AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #31 | Gemma 4 26B A4B medium | 2.9 | 7.8 | 0/2 | 258.4s | |
| #63 | Qwen3.5-35B-A3B medium | Qwen | 6.5 | 7.3 | 1/2 | 244.5s |
| #71 | Seed-2.0-Mini medium | Bytedance Seed | 6.8 | 7.1 | 1/2 | 220.5s |
| #79 | Kimi K2.5 medium | Moonshot AI | 4.1 | 6.7 | 0/2 | 215.9s |
| #35 | Qwen3.6 Plus medium | Qwen | 4.1 | 7.8 | 0/2 | 201.7s |
| #21 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 7.6 | 8.1 | 1/2 | 193.8s |
| #73 | DeepSeek V3.2 medium | DeepSeek | 3.9 | 7.0 | 0/2 | 185.0s |
| #75 | MiMo-V2-Omni medium | Xiaomi | 3.4 | 6.9 | 0/2 | 183.9s |
| #15 | Qwen3.6 Max Preview medium | Qwen | 8.2 | 8.4 | 1/2 | 178.0s |
| #81 | Qwen3.6 27B medium | Qwen | 6.6 | 6.6 | 1/2 | 165.4s |
| #54 | GLM 5.1 medium | Z.ai | 4.7 | 7.4 | 0/2 | 145.6s |
| #65 | Ring-2.6-1T none | Inclusionai | 10.0 | 7.2 | 1/1 | 143.8s |
| #51 | Gemini 3.1 Flash Lite high | 10.0 | 7.5 | 1/1 | 137.6s | |
| #48 | Qwen3.5 Plus 2026-04-20 medium | Qwen | 5.4 | 7.6 | 1/2 | 137.5s |
| #151 | Qwen3.5-9B medium | Qwen | 2.8 | 4.2 | 0/2 | 135.6s |