AI BENCHY श्रेणी
सामान्य ज्ञान रैंकिंग
देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.
विफलता के कारण
| रैंक | मॉडल | कंपनी | सामान्य ज्ञान स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #40 | Gemini 3.1 Flash Lite Preview none | 3.0 | 7.7 | 0/1 | 814ms | |
| #98 | GPT-5.4 none | OpenAI | 3.0 | 5.7 | 0/1 | 990ms |
| #118 | Ling-2.6-flash none | Inclusionai | 3.0 | 5.3 | 0/1 | 1.06s |
| #29 | Gemini 3 Flash Preview none | 3.0 | 7.9 | 0/1 | 1.07s | |
| #76 | Qwen3.5 Plus 2026-02-15 none | Qwen | 3.0 | 6.5 | 0/1 | 1.11s |
| #81 | Gemini 2.5 Flash none | 3.0 | 6.3 | 0/1 | 1.15s | |
| #64 | Gemma 4 31B none | 3.0 | 6.9 | 0/1 | 1.25s | |
| #79 | MiMo-V2-Omni none | Xiaomi | 3.0 | 6.3 | 0/1 | 1.30s |
| #125 | GPT-5.4 Mini none | OpenAI | 3.0 | 5.0 | 0/1 | 1.33s |
| #30 | Gemini 3.1 Flash Lite Preview low | 3.0 | 7.9 | 0/1 | 1.35s | |
| #100 | Kimi K2.6 none | Moonshot AI | 3.0 | 5.7 | 0/1 | 1.36s |
| #5 | Claude Opus 4.7 none | Anthropic | 3.0 | 8.9 | 0/1 | 1.46s |
| #44 | Gemini 3.1 Flash Lite low | 3.0 | 7.6 | 0/1 | 1.46s | |
| #92 | MiMo-V2-Pro none | Xiaomi | 3.0 | 5.9 | 0/1 | 1.63s |
| #137 | MiMo-V2-Flash none | Xiaomi | 3.0 | 4.5 | 0/1 | 1.82s |