AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #142 | Mistral Small 4 none | Mistral | 3.0 | 4.9 | 0/1 | 1.72s |
| #163 | Granite 4.1 8B none | IBM Granite | 3.0 | 4.0 | 0/1 | 1.88s |
| #146 | Laguna Xs.2 none | Poolside | 3.0 | 4.8 | 0/1 | 2.01s |
| #34 | Qwen3.7 Max none | Qwen | 3.0 | 7.7 | 0/1 | 2.17s |
| #143 | MiMo-V2.5 none | Xiaomi | 3.0 | 4.9 | 0/1 | 2.36s |
| #144 | GPT-5.4 Mini none | OpenAI | 3.0 | 4.9 | 0/1 | 2.52s |
| #87 | Gemini 3.1 Flash Lite minimal | 3.0 | 6.4 | 0/1 | 2.53s | |
| #90 | Gemini 3.1 Flash Lite none | 3.0 | 6.4 | 0/1 | 2.73s | |
| #152 | MiMo-V2-Flash none | Xiaomi | 3.0 | 4.6 | 0/1 | 2.87s |
| #125 | GPT-5.4 none | OpenAI | 3.0 | 5.5 | 0/1 | 2.89s |
| #58 | Gemini 3.1 Flash Lite Preview none | 3.0 | 7.2 | 0/1 | 3.20s | |
| #122 | GLM 4.7 Flash none | Z.ai | 3.0 | 5.5 | 0/1 | 3.22s |
| #16 | Gemini 3 Flash Preview low | 3.0 | 8.4 | 0/1 | 3.27s | |
| #81 | Mercury 2 medium | Inception | 10.0 | 6.6 | 1/1 | 3.28s |
| #157 | Grok 4.1 Fast none | X AI | 3.0 | 4.4 | 0/1 | 3.33s |