AI BENCHY श्रेणी
सामान्य ज्ञान रैंकिंग
देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.
विफलता के कारण
| रैंक | मॉडल | कंपनी | सामान्य ज्ञान स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #101 | GLM 5.1 none | Z.ai | 3.0 | 5.7 | 0/1 | 2.34s |
| #102 | MiMo-V2.5-Pro none | Xiaomi | 3.0 | 5.7 | 0/1 | 1.89s |
| #104 | DeepSeek V3.2 none | DeepSeek | 3.0 | 5.7 | 0/1 | 17.2s |
| #105 | Qwen3.6 Flash none | Qwen | 3.0 | 5.6 | 0/1 | 649ms |
| #106 | MiniMax M2.5 medium | Minimax | 3.0 | 5.5 | 0/1 | 80.8s |
| #107 | Mistral Small 4 medium | Mistral | 3.0 | 5.5 | 0/1 | 5.92s |
| #109 | Elephant Alpha medium | Openrouter | 0.0 | 5.5 | 0/0 | 0ms |
| #110 | Qwen3.5-122B-A10B none | Qwen | 3.0 | 5.5 | 0/1 | 295ms |
| #111 | Nemotron 3 Nano Omni 30b A3b Reasoning medium | NVIDIA | 0.0 | 5.4 | 0/0 | 0ms |
| #112 | Kimi K2.5 none | Moonshot AI | 3.0 | 5.4 | 0/1 | 3.90s |
| #114 | GLM 5 Turbo none | Z.ai | 3.0 | 5.4 | 0/1 | 2.37s |
| #115 | Laguna M.1 none | Poolside | 0.0 | 5.4 | 0/0 | 0ms |
| #116 | Elephant Alpha none | Openrouter | 0.0 | 5.3 | 0/0 | 0ms |
| #117 | Laguna Xs.2 none | Poolside | 0.0 | 5.3 | 0/0 | 0ms |
| #118 | Ling-2.6-flash none | Inclusionai | 3.0 | 5.3 | 0/1 | 1.06s |