AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #54 | GPT-5 Nano medium | OpenAI | 6.7 | 6.3 | 0/1 | 40.7s |
| #69 | Mistral Small 4 medium | Mistral | 6.7 | 5.7 | 0/1 | 30.5s |
| #52 | MiMo-V2-Omni none | Xiaomi | 6.6 | 6.5 | 0/1 | 1.72s |
| #70 | GLM 4.7 Flash none | Z.ai | 6.4 | 5.6 | 0/1 | 5.57s |
| #46 | Qwen3.5 Plus 2026-02-15 none | Qwen | 6.3 | 6.8 | 0/1 | 3.63s |
| #88 | MiMo-V2-Flash none | Xiaomi | 6.3 | 4.5 | 0/1 | 2.79s |
| #74 | Trinity Large Preview none | Arcee AI | 6.3 | 5.3 | 0/1 | 39.5s |
| #50 | GLM 5 none | Z.ai | 5.6 | 6.6 | 0/1 | 8.84s |
| #75 | Grok 4.20 Beta none | X AI | 5.5 | 5.3 | 0/1 | 1.14s |
| #73 | GLM 5 Turbo none | Z.ai | 5.3 | 5.5 | 0/1 | 3.93s |
| #89 | Grok 4.1 Fast none | X AI | 5.3 | 4.5 | 0/1 | 1.79s |
| #84 | Qwen3.5-9B none | Qwen | 5.2 | 4.8 | 0/1 | 5.69s |
| #71 | GLM 5.1 none | Z.ai | 5.1 | 5.6 | 0/1 | 9.79s |
| #12 | Gemma 4 31B medium | 4.7 | 8.3 | 0/1 | 71.0s | |
| #17 | Qwen3.5-122B-A10B medium | Qwen | 4.7 | 8.1 | 0/1 | 71.0s |