AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #133 | Qwen3 Coder Next none | Qwen | 5.4 | 5.1 | 0/2 | 2.01s |
| #134 | Nemotron 3 Super none | NVIDIA | 3.4 | 5.0 | 0/2 | 3.02s |
| #135 | Mistral Small 4 none | Mistral | 4.0 | 5.0 | 0/2 | 1.03s |
| #139 | GPT-4o-mini none | OpenAI | 3.2 | 4.9 | 0/2 | 2.05s |
| #140 | Trinity Large Preview none | Arcee AI | 4.9 | 4.8 | 0/1 | 14.3s |
| #141 | GPT-5.4 Nano none | OpenAI | 5.4 | 4.8 | 0/2 | 1.09s |
| #142 | Qwen3 Coder Next medium | Qwen | 4.1 | 4.7 | 0/2 | 1.17s |
| #143 | Qwen3.5-9B none | Qwen | 4.4 | 4.7 | 0/2 | 5.39s |
| #144 | MiMo-V2-Flash none | Xiaomi | 4.9 | 4.7 | 0/2 | 2.04s |
| #146 | Mercury 2 none | Inception | 3.5 | 4.6 | 0/2 | 831ms |
| #147 | Hy3 preview none | Tencent | 2.3 | 4.6 | 0/1 | 4.56s |
| #148 | Ling-2.6-1T none | Inclusionai | 5.5 | 4.5 | 0/1 | 10.6s |
| #149 | GLM 4.7 Flash medium | Z.ai | 3.4 | 4.5 | 0/2 | 55.3s |
| #150 | Grok 4.1 Fast none | X AI | 5.3 | 4.4 | 0/1 | 1.79s |
| #151 | Qwen3.5-9B medium | Qwen | 2.8 | 4.2 | 0/2 | 135.6s |