AI BENCHY श्रेणी
सामान्य ज्ञान रैंकिंग
देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.
विफलता के कारण
| रैंक | मॉडल | कंपनी | सामान्य ज्ञान स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #102 | MiMo-V2.5-Pro none | Xiaomi | 3.0 | 5.7 | 0/1 | 1.89s |
| #55 | MiMo-V2-Flash medium | Xiaomi | 3.0 | 7.2 | 0/1 | 1.96s |
| #86 | Seed-2.0-Lite none | Bytedance Seed | 3.0 | 6.0 | 0/1 | 1.96s |
| #54 | Qwen3.6 Max Preview none | Qwen | 3.0 | 7.2 | 0/1 | 1.97s |
| #87 | GLM 5V Turbo none | Z.ai | 3.0 | 6.0 | 0/1 | 2.23s |
| #3 | Claude Opus 4.7 medium | Anthropic | 3.0 | 8.9 | 0/1 | 2.25s |
| #132 | Qwen3.5-9B none | Qwen | 3.0 | 4.7 | 0/1 | 2.32s |
| #101 | GLM 5.1 none | Z.ai | 3.0 | 5.7 | 0/1 | 2.34s |
| #114 | GLM 5 Turbo none | Z.ai | 3.0 | 5.4 | 0/1 | 2.37s |
| #88 | Owl Alpha medium | Openrouter | 3.0 | 6.0 | 0/1 | 2.38s |
| #96 | Owl Alpha none | Openrouter | 3.0 | 5.8 | 0/1 | 2.50s |
| #80 | Mercury 2 medium | Inception | 3.0 | 6.3 | 0/1 | 2.58s |
| #23 | Gemini 3.1 Flash Lite Preview medium | 3.0 | 8.0 | 0/1 | 2.68s | |
| #133 | HY3 Preview none | Tencent | 3.0 | 4.6 | 0/1 | 2.71s |
| #7 | Gemini 3 Flash Preview low | 10.0 | 8.8 | 1/1 | 2.75s |