AI BENCHY श्रेणी
सामान्य ज्ञान रैंकिंग
देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.
169/169
मॉडल फ़िल्टर करें
मौजूदा खोज और फ़िल्टर से कोई मॉडल मेल नहीं खाता।
| रैंक | मॉडल | कंपनी | सामान्य ज्ञान स्कोर | स्कोर | कुल लागत | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|---|
| #36 | Qwen3.5-122B-A10B medium | Qwen | 3.0 | 7.7 | $0.588 | 0/1 | 52.9s |
| #37 | Grok 4.3 medium | X AI | 3.0 | 7.7 | $0.614 | 0/1 | 44.5s |
| #38 | Claude Opus 4.6 medium | Anthropic | 3.0 | 7.7 | $2.053 | 0/1 | 63.2s |
| #39 | Step 3.7 Flash low | Stepfun | 3.0 | 7.7 | $0.341 | 0/1 | 124.8s |
| #40 | MiniMax M3 medium | Minimax | 3.0 | 7.6 | $0.131 | 0/1 | 100.8s |
| #41 | DeepSeek V4 Pro high | DeepSeek | 3.0 | 7.6 | $0.157 | 0/1 | 34.0s |
| #42 | Grok Build 0.1 medium | X AI | 3.0 | 7.6 | $0.927 | 0/1 | 53.5s |
| #43 | Kimi K2.5 medium | Moonshot AI | 3.0 | 7.5 | $0.348 | 0/1 | 83.9s |
| #44 | Mercury 2 medium | Inception | 3.0 | 7.5 | $0.058 | 0/1 | 2.58s |
| #45 | GPT-5.3 Chat none | OpenAI | 3.0 | 7.5 | $0.433 | 0/1 | 4.38s |
| #46 | GPT-5.4 Nano medium | OpenAI | 3.0 | 7.5 | $0.107 | 0/1 | 4.81s |
| #47 | Qwen3.6 Flash medium | Qwen | 3.0 | 7.5 | $0.288 | 0/1 | 122.9s |
| #48 | DeepSeek V3.2 medium | DeepSeek | 3.0 | 7.5 | $0.044 | 0/1 | 84.0s |
| #49 | Claude Opus 4.7 none | Anthropic | 3.0 | 7.4 | $0.505 | 0/1 | 1.46s |
| #50 | Seed-2.0-Mini medium | Bytedance Seed | 3.0 | 7.4 | $0.044 | 0/1 | 56.8s |