AI BENCHY श्रेणी
सामान्य ज्ञान रैंकिंग
देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.
विफलता के कारण
| रैंक | मॉडल | कंपनी | सामान्य ज्ञान स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #96 | Owl Alpha none | Openrouter | 3.0 | 5.8 | 0/1 | 2.50s |
| #88 | Owl Alpha medium | Openrouter | 3.0 | 6.0 | 0/1 | 2.38s |
| #114 | GLM 5 Turbo none | Z.ai | 3.0 | 5.4 | 0/1 | 2.37s |
| #101 | GLM 5.1 none | Z.ai | 3.0 | 5.7 | 0/1 | 2.34s |
| #132 | Qwen3.5-9B none | Qwen | 3.0 | 4.7 | 0/1 | 2.32s |
| #3 | Claude Opus 4.7 medium | Anthropic | 3.0 | 8.9 | 0/1 | 2.25s |
| #87 | GLM 5V Turbo none | Z.ai | 3.0 | 6.0 | 0/1 | 2.23s |
| #54 | Qwen3.6 Max Preview none | Qwen | 3.0 | 7.2 | 0/1 | 1.97s |
| #86 | Seed-2.0-Lite none | Bytedance Seed | 3.0 | 6.0 | 0/1 | 1.96s |
| #55 | MiMo-V2-Flash medium | Xiaomi | 3.0 | 7.2 | 0/1 | 1.96s |
| #102 | MiMo-V2.5-Pro none | Xiaomi | 3.0 | 5.7 | 0/1 | 1.89s |
| #137 | MiMo-V2-Flash none | Xiaomi | 3.0 | 4.5 | 0/1 | 1.82s |
| #92 | MiMo-V2-Pro none | Xiaomi | 3.0 | 5.9 | 0/1 | 1.63s |
| #44 | Gemini 3.1 Flash Lite low | 3.0 | 7.6 | 0/1 | 1.46s | |
| #5 | Claude Opus 4.7 none | Anthropic | 3.0 | 8.9 | 0/1 | 1.46s |