AI BENCHY श्रेणी
सामान्य ज्ञान रैंकिंग
देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।
विफलता के कारण
| रैंक | मॉडल | कंपनी | सामान्य ज्ञान स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #105 | Qwen3.6 Flash none | Qwen | 3.0 | 5.6 | 0/1 | 649ms |
| #106 | MiniMax M2.5 medium | Minimax | 3.0 | 5.5 | 0/1 | 80.8s |
| #107 | Mistral Small 4 medium | Mistral | 3.0 | 5.5 | 0/1 | 5.92s |
| #110 | Qwen3.5-122B-A10B none | Qwen | 3.0 | 5.5 | 0/1 | 295ms |
| #112 | Kimi K2.5 none | Moonshot AI | 3.0 | 5.4 | 0/1 | 3.90s |
| #114 | GLM 5 Turbo none | Z.ai | 3.0 | 5.4 | 0/1 | 2.37s |
| #118 | Ling-2.6-flash none | Inclusionai | 3.0 | 5.3 | 0/1 | 1.06s |
| #119 | gpt-oss-120b none | OpenAI | 3.0 | 5.2 | 0/1 | 47.3s |
| #120 | DeepSeek V4 Flash none | DeepSeek | 3.0 | 5.2 | 0/1 | 3.07s |
| #121 | Qwen3 Coder Next none | Qwen | 3.0 | 5.2 | 0/1 | 601ms |
| #122 | Nemotron 3 Super none | NVIDIA | 3.0 | 5.2 | 0/1 | 8.94s |
| #123 | MiniMax M2.7 medium | Minimax | 3.0 | 5.1 | 0/1 | 22.8s |
| #124 | Mistral Small 4 none | Mistral | 3.0 | 5.1 | 0/1 | 397ms |
| #125 | GPT-5.4 Mini none | OpenAI | 3.0 | 5.0 | 0/1 | 1.33s |
| #126 | Qwen3.6 35B A3B none | Qwen | 3.0 | 5.0 | 0/1 | 414ms |