AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #102 | GLM 5.1 none | Z.ai | 4.3 | 5.8 | 0/2 | 6.33s |
| #103 | Qwen3.5 Plus 2026-04-20 none | Qwen | 4.4 | 5.8 | 0/2 | 2.08s |
| #105 | Grok 4.20 Beta none | X AI | 5.5 | 5.8 | 0/1 | 1.14s |
| #108 | Cobuddy medium | Baidu | 4.1 | 5.8 | 0/2 | 79.2s |
| #109 | DeepSeek V3.2 none | DeepSeek | 3.1 | 5.7 | 0/2 | 20.9s |
| #112 | Hunter Alpha none | OpenRouter | 3.0 | 5.7 | 0/1 | 0ms |
| #113 | GLM 4.7 Flash none | Z.ai | 5.0 | 5.6 | 0/2 | 3.35s |
| #115 | MiMo-V2.5-Pro none | Xiaomi | 5.0 | 5.6 | 0/2 | 1.80s |
| #118 | MiniMax M2.5 medium | Minimax | 3.5 | 5.5 | 0/2 | 125.8s |
| #119 | gpt-oss-120b none | OpenAI | 4.3 | 5.4 | 0/1 | 9.57s |
| #120 | Grok 4.20 none | X AI | 3.4 | 5.4 | 0/1 | 1.22s |
| #121 | Mistral Small 4 medium | Mistral | 5.1 | 5.4 | 0/2 | 44.8s |
| #122 | Elephant Alpha medium | Openrouter | 4.0 | 5.4 | 0/2 | 1.30s |
| #124 | Laguna M.1 none | Poolside | 7.5 | 5.4 | 0/1 | 2.93s |
| #125 | Qwen3.5-122B-A10B none | Qwen | 4.0 | 5.4 | 0/2 | 2.14s |