AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #141 | GPT-5.4 Nano none | OpenAI | 5.4 | 4.8 | 0/2 | 1.09s |
| #48 | Qwen3.5 Plus 2026-04-20 medium | Qwen | 5.4 | 7.6 | 1/2 | 137.5s |
| #133 | Qwen3 Coder Next none | Qwen | 5.4 | 5.1 | 0/2 | 2.01s |
| #150 | Grok 4.1 Fast none | X AI | 5.3 | 4.4 | 0/1 | 1.79s |
| #153 | Granite 4.1 8B none | IBM Granite | 5.2 | 4.1 | 0/2 | 706ms |
| #43 | Qwen3.6 Flash medium | Qwen | 5.1 | 7.6 | 0/2 | 51.9s |
| #121 | Mistral Small 4 medium | Mistral | 5.1 | 5.4 | 0/2 | 44.8s |
| #93 | MiMo-V2-Omni none | Xiaomi | 5.1 | 6.2 | 0/2 | 2.75s |
| #115 | MiMo-V2.5-Pro none | Xiaomi | 5.0 | 5.6 | 0/2 | 1.80s |
| #113 | GLM 4.7 Flash none | Z.ai | 5.0 | 5.6 | 0/2 | 3.35s |
| #140 | Trinity Large Preview none | Arcee AI | 4.9 | 4.8 | 0/1 | 14.3s |
| #89 | Qwen3.5 Plus 2026-02-15 none | Qwen | 4.9 | 6.4 | 0/2 | 2.54s |
| #144 | MiMo-V2-Flash none | Xiaomi | 4.9 | 4.7 | 0/2 | 2.04s |
| #132 | DeepSeek V4 Flash none | DeepSeek | 4.8 | 5.1 | 0/2 | 24.5s |
| #131 | Elephant Alpha none | Openrouter | 4.7 | 5.2 | 0/2 | 1.39s |