AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #35 | Qwen3.6 Plus medium | Qwen | 4.1 | 7.8 | 0/2 | 201.7s |
| #40 | Qwen3.5-122B-A10B medium | Qwen | 4.1 | 7.7 | 0/2 | 119.6s |
| #43 | Qwen3.6 Flash medium | Qwen | 5.1 | 7.6 | 0/2 | 51.9s |
| #47 | Qwen3.5-Flash medium | Qwen | 4.1 | 7.6 | 0/2 | 54.2s |
| #54 | GLM 5.1 medium | Z.ai | 4.7 | 7.4 | 0/2 | 145.6s |
| #58 | Step 3.5 Flash medium | Stepfun | 3.0 | 7.4 | 0/1 | 62.8s |
| #62 | Laguna M.1 medium | Poolside | 4.3 | 7.3 | 0/1 | 35.6s |
| #69 | Qwen3.6 Max Preview none | Qwen | 4.2 | 7.1 | 0/2 | 3.06s |
| #70 | MiMo-V2-Flash medium | Xiaomi | 4.1 | 7.1 | 0/2 | 7.20s |
| #73 | DeepSeek V3.2 medium | DeepSeek | 3.9 | 7.0 | 0/2 | 185.0s |
| #74 | Grok 4.20 medium | X AI | 4.1 | 7.0 | 0/2 | 65.1s |
| #75 | MiMo-V2-Omni medium | Xiaomi | 3.4 | 6.9 | 0/2 | 183.9s |
| #76 | Hunter Alpha medium | OpenRouter | 3.0 | 6.7 | 0/1 | 0ms |
| #79 | Kimi K2.5 medium | Moonshot AI | 4.1 | 6.7 | 0/2 | 215.9s |
| #82 | Laguna Xs.2 medium | Poolside | 6.3 | 6.6 | 0/1 | 14.4s |