AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #47 | Qwen3.5-Flash medium | Qwen | 4.1 | 7.6 | 0/2 | 54.2s |
| #4 | Gemini 3.1 Pro Preview medium | 7.0 | 9.3 | 1/2 | 54.3s | |
| #38 | Gemini 2.5 Flash medium | 6.6 | 7.7 | 1/2 | 54.6s | |
| #123 | MiniMax M2.7 medium | Minimax | 6.7 | 5.4 | 1/2 | 54.7s |
| #59 | GLM 5V Turbo medium | Z.ai | 6.8 | 7.4 | 1/2 | 54.8s |
| #28 | GPT-5.4 medium | OpenAI | 8.2 | 7.9 | 1/2 | 55.0s |
| #33 | Grok 4.3 medium | X AI | 7.4 | 7.8 | 1/2 | 55.3s |
| #149 | GLM 4.7 Flash medium | Z.ai | 3.4 | 4.5 | 0/2 | 55.3s |
| #44 | DeepSeek V4 Flash high | DeepSeek | 6.8 | 7.6 | 1/2 | 58.1s |
| #32 | Qwen3.6 35B A3B medium | Qwen | 6.6 | 7.8 | 1/2 | 59.3s |
| #64 | Ring-2.6-1T medium | Inclusionai | 10.0 | 7.2 | 1/1 | 59.6s |
| #96 | Nemotron 3 Super medium | NVIDIA | 3.1 | 5.9 | 0/2 | 62.4s |
| #42 | Grok Build 0.1 medium | X AI | 7.0 | 7.7 | 1/2 | 62.6s |
| #58 | Step 3.5 Flash medium | Stepfun | 3.0 | 7.4 | 0/1 | 62.8s |
| #56 | MiMo-V2.5 medium | Xiaomi | 6.9 | 7.4 | 1/2 | 64.5s |