AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #83 | DeepSeek V4 Pro high | DeepSeek | 2.8 | 6.6 | 0/2 | 51.8s |
| #88 | Grok 4.1 Fast medium | X AI | 2.3 | 6.5 | 0/1 | 23.6s |
| #89 | Qwen3.5 Plus 2026-02-15 none | Qwen | 4.9 | 6.4 | 0/2 | 2.54s |
| #91 | GLM 5 none | Z.ai | 4.6 | 6.3 | 0/2 | 5.18s |
| #92 | Gemma 4 26B A4B none | 4.1 | 6.2 | 0/2 | 3.83s | |
| #93 | MiMo-V2-Omni none | Xiaomi | 5.1 | 6.2 | 0/2 | 2.75s |
| #94 | GPT-5 Nano medium | OpenAI | 5.4 | 6.1 | 0/2 | 47.8s |
| #95 | DeepSeek V4 Pro none | DeepSeek | 5.4 | 6.0 | 0/2 | 8.27s |
| #96 | Nemotron 3 Super medium | NVIDIA | 3.1 | 5.9 | 0/2 | 62.4s |
| #97 | gpt-oss-120b medium | OpenAI | 3.9 | 5.9 | 0/2 | 47.2s |
| #102 | GLM 5.1 none | Z.ai | 4.3 | 5.8 | 0/2 | 6.33s |
| #103 | Qwen3.5 Plus 2026-04-20 none | Qwen | 4.4 | 5.8 | 0/2 | 2.08s |
| #105 | Grok 4.20 Beta none | X AI | 5.5 | 5.8 | 0/1 | 1.14s |
| #108 | Cobuddy medium | Baidu | 4.1 | 5.8 | 0/2 | 79.2s |
| #109 | DeepSeek V3.2 none | DeepSeek | 3.1 | 5.7 | 0/2 | 20.9s |