AI BENCHY श्रेणी
सामान्य ज्ञान रैंकिंग
देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।
विफलता के कारण
| रैंक | मॉडल | कंपनी | सामान्य ज्ञान स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #89 | Qwen3.5-Flash none | Qwen | 3.0 | 6.0 | 0/1 | 588ms |
| #90 | Qwen3.5 Plus 2026-04-20 none | Qwen | 3.0 | 5.9 | 0/1 | 33.3s |
| #91 | Qwen3.5-35B-A3B none | Qwen | 3.0 | 5.9 | 0/1 | 493ms |
| #92 | MiMo-V2-Pro none | Xiaomi | 3.0 | 5.9 | 0/1 | 1.63s |
| #93 | Qwen3.5-27B none | Qwen | 3.0 | 5.9 | 0/1 | 599ms |
| #94 | Qwen3.6 27B none | Qwen | 3.0 | 5.8 | 0/1 | 4.03s |
| #95 | Cobuddy medium | Baidu | 3.0 | 5.8 | 0/1 | 37.0s |
| #96 | Owl Alpha none | Openrouter | 3.0 | 5.8 | 0/1 | 2.50s |
| #97 | GLM 4.7 Flash none | Z.ai | 3.0 | 5.8 | 0/1 | 692ms |
| #98 | GPT-5.4 none | OpenAI | 3.0 | 5.7 | 0/1 | 990ms |
| #99 | gpt-oss-120b medium | OpenAI | 3.0 | 5.7 | 0/1 | 26.5s |
| #100 | Kimi K2.6 none | Moonshot AI | 3.0 | 5.7 | 0/1 | 1.36s |
| #101 | GLM 5.1 none | Z.ai | 3.0 | 5.7 | 0/1 | 2.34s |
| #102 | MiMo-V2.5-Pro none | Xiaomi | 3.0 | 5.7 | 0/1 | 1.89s |
| #104 | DeepSeek V3.2 none | DeepSeek | 3.0 | 5.7 | 0/1 | 17.2s |