AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #51 | Mercury 2 medium | Inception | 10.0 | 6.5 | 1/1 | 1.53s |
| #53 | Grok 4.20 Multi Agent Beta medium | X AI | 10.0 | 6.4 | 1/1 | 27.1s |
| #55 | GLM 5V Turbo none | Z.ai | 10.0 | 6.2 | 1/1 | 5.30s |
| #56 | Qwen3.5-Flash none | Qwen | 10.0 | 6.2 | 1/1 | 1.29s |
| #58 | Seed-2.0-Lite none | Bytedance Seed | 10.0 | 6.2 | 1/1 | 4.61s |
| #59 | Gemini 2.5 Flash none | 10.0 | 6.2 | 1/1 | 1.16s | |
| #60 | Qwen3.5-35B-A3B none | Qwen | 10.0 | 6.1 | 1/1 | 2.67s |
| #62 | MiMo-V2-Pro none | Xiaomi | 10.0 | 6.0 | 1/1 | 3.82s |
| #63 | GPT-5.4 none | OpenAI | 10.0 | 5.9 | 1/1 | 2.95s |
| #64 | Qwen3.5-27B none | Qwen | 10.0 | 5.9 | 1/1 | 2.51s |
| #72 | Kimi K2.5 none | Moonshot AI | 10.0 | 5.5 | 1/1 | 38.8s |
| #76 | MiniMax M2.7 medium | Minimax | 10.0 | 5.3 | 1/1 | 91.3s |
| #80 | GPT-5.4 Mini none | OpenAI | 10.0 | 5.1 | 1/1 | 1.19s |
| #81 | Qwen3 Coder Next none | Qwen | 7.3 | 5.1 | 0/1 | 3.14s |
| #90 | GPT-5.4 Nano none | OpenAI | 7.1 | 4.5 | 0/1 | 1.43s |