AI BENCHY श्रेणी
सामान्य ज्ञान रैंकिंग
देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: कुल लागत ↓.
169/169
मॉडल फ़िल्टर करें
मौजूदा खोज और फ़िल्टर से कोई मॉडल मेल नहीं खाता।
| रैंक | मॉडल | कंपनी | सामान्य ज्ञान स्कोर | स्कोर | कुल लागत | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|---|
| #84 | Gemini 3.1 Flash Lite Preview none | 3.0 | 6.4 | $0.018 | 0/1 | 814ms | |
| #126 | DeepSeek V3.2 none | DeepSeek | 3.0 | 5.3 | $0.017 | 0/1 | 17.2s |
| #119 | MiMo-V2.5-Pro none | Xiaomi | 3.0 | 5.5 | $0.017 | 0/1 | 1.89s |
| #106 | Qwen3.5 Plus 2026-02-15 none | Qwen | 3.0 | 5.8 | $0.016 | 0/1 | 1.11s |
| #93 | Gemini 2.5 Flash none | 3.0 | 6.2 | $0.016 | 0/1 | 1.15s | |
| #104 | Qwen3.5-27B none | Qwen | 3.0 | 5.9 | $0.015 | 0/1 | 599ms |
| #102 | Qwen3.6 Flash none | Qwen | 3.0 | 6.0 | $0.015 | 0/1 | 649ms |
| #94 | Gemini 3.1 Flash Lite minimal | 3.0 | 6.1 | $0.013 | 0/1 | 724ms | |
| #96 | Gemini 3.1 Flash Lite none | 3.0 | 6.1 | $0.013 | 0/1 | 733ms | |
| #78 | gpt-oss-120b medium | OpenAI | 3.0 | 6.7 | $0.013 | 0/1 | 26.5s |
| #103 | Qwen3.5-35B-A3B none | Qwen | 3.0 | 5.9 | $0.012 | 0/1 | 493ms |
| #151 | Mercury 2 none | Inception | 3.0 | 4.6 | $0.011 | 0/1 | 548ms |
| #145 | GPT-5.4 Nano none | OpenAI | 3.0 | 4.8 | $0.011 | 0/1 | 773ms |
| #164 | gpt-oss-120b none | OpenAI | 3.0 | 4.0 | $0.010 | 0/1 | 47.3s |
| #130 | Qwen3 Coder Next none | Qwen | 3.0 | 5.1 | $0.009 | 0/1 | 601ms |