AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #92 | Qwen3 Coder Next medium | Qwen | 3.0 | 4.7 | 0/1 | 4.28s |
| #96 | GPT-5.4 Nano none | OpenAI | 3.0 | 4.5 | 0/1 | 3.84s |
| #85 | Elephant none | Openrouter | 3.0 | 5.2 | 0/1 | 3.81s |
| #81 | Elephant medium | Openrouter | 3.0 | 5.2 | 0/1 | 3.70s |
| #21 | Gemini 3 Flash Preview none | 4.7 | 8.1 | 0/1 | 3.56s | |
| #69 | Kimi K2.6 none | Moonshot AI | 3.0 | 5.8 | 0/1 | 3.38s |
| #95 | Grok 4.1 Fast none | X AI | 3.0 | 4.5 | 0/1 | 3.33s |
| #54 | Mercury 2 medium | Inception | 10.0 | 6.5 | 1/1 | 3.28s |
| #5 | Gemini 3 Flash Preview low | 3.0 | 8.8 | 0/1 | 3.27s | |
| #74 | GLM 4.7 Flash none | Z.ai | 3.0 | 5.6 | 0/1 | 3.22s |
| #29 | Gemini 3.1 Flash Lite Preview none | 3.0 | 7.9 | 0/1 | 3.20s | |
| #66 | GPT-5.4 none | OpenAI | 3.0 | 5.9 | 0/1 | 2.89s |
| #94 | MiMo-V2-Flash none | Xiaomi | 3.0 | 4.5 | 0/1 | 2.87s |
| #86 | GPT-5.4 Mini none | OpenAI | 3.0 | 5.1 | 0/1 | 2.52s |
| #55 | MiMo-V2-Omni none | Xiaomi | 3.0 | 6.5 | 0/1 | 2.47s |