AI BENCHY श्रेणी
सामान्य ज्ञान रैंकिंग
देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: कुल लागत ↑.
169/169
मॉडल फ़िल्टर करें
मौजूदा खोज और फ़िल्टर से कोई मॉडल मेल नहीं खाता।
| रैंक | मॉडल | कंपनी | सामान्य ज्ञान स्कोर | स्कोर | कुल लागत | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|---|
| #117 | DeepSeek V4 Flash none | DeepSeek | 3.0 | 5.5 | $0.007 | 0/1 | 3.07s |
| #161 | Grok 4.1 Fast none | X AI | 3.0 | 4.0 | $0.008 | 0/1 | 731ms |
| #137 | Trinity Large Preview none | Arcee AI | 3.0 | 5.0 | $0.008 | 0/1 | 777ms |
| #148 | Qwen3 Coder Next medium | Qwen | 3.0 | 4.7 | $0.008 | 0/1 | 399ms |
| #130 | Qwen3 Coder Next none | Qwen | 3.0 | 5.1 | $0.009 | 0/1 | 601ms |
| #164 | gpt-oss-120b none | OpenAI | 3.0 | 4.0 | $0.010 | 0/1 | 47.3s |
| #145 | GPT-5.4 Nano none | OpenAI | 3.0 | 4.8 | $0.011 | 0/1 | 773ms |
| #151 | Mercury 2 none | Inception | 3.0 | 4.6 | $0.011 | 0/1 | 548ms |
| #103 | Qwen3.5-35B-A3B none | Qwen | 3.0 | 5.9 | $0.012 | 0/1 | 493ms |
| #78 | gpt-oss-120b medium | OpenAI | 3.0 | 6.7 | $0.013 | 0/1 | 26.5s |
| #96 | Gemini 3.1 Flash Lite none | 3.0 | 6.1 | $0.013 | 0/1 | 733ms | |
| #94 | Gemini 3.1 Flash Lite minimal | 3.0 | 6.1 | $0.013 | 0/1 | 724ms | |
| #102 | Qwen3.6 Flash none | Qwen | 3.0 | 6.0 | $0.015 | 0/1 | 649ms |
| #104 | Qwen3.5-27B none | Qwen | 3.0 | 5.9 | $0.015 | 0/1 | 599ms |
| #93 | Gemini 2.5 Flash none | 3.0 | 6.2 | $0.016 | 0/1 | 1.15s |