AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #17 | Qwen3.6 Plus Preview medium | Qwen | 0.0 | 8.2 | 0/0 | 0ms |
| #20 | Gemini 3 PRO Preview medium | 3.0 | 8.1 | 0/2 | 0ms | |
| #24 | Gemma 4 31B medium | 3.8 | 8.0 | 0/2 | 110.9s | |
| #31 | Gemma 4 26B A4B medium | 2.9 | 7.8 | 0/2 | 258.4s | |
| #34 | Step 3.5 Flash none | Stepfun | 3.0 | 7.8 | 0/1 | 0ms |
| #35 | Qwen3.6 Plus medium | Qwen | 4.1 | 7.8 | 0/2 | 201.7s |
| #40 | Qwen3.5-122B-A10B medium | Qwen | 4.1 | 7.7 | 0/2 | 119.6s |
| #43 | Qwen3.6 Flash medium | Qwen | 5.1 | 7.6 | 0/2 | 51.9s |
| #47 | Qwen3.5-Flash medium | Qwen | 4.1 | 7.6 | 0/2 | 54.2s |
| #54 | GLM 5.1 medium | Z.ai | 4.7 | 7.4 | 0/2 | 145.6s |
| #58 | Step 3.5 Flash medium | Stepfun | 3.0 | 7.4 | 0/1 | 62.8s |
| #62 | Laguna M.1 medium | Poolside | 4.3 | 7.3 | 0/1 | 35.6s |
| #69 | Qwen3.6 Max Preview none | Qwen | 4.2 | 7.1 | 0/2 | 3.06s |
| #70 | MiMo-V2-Flash medium | Xiaomi | 4.1 | 7.1 | 0/2 | 7.20s |
| #73 | DeepSeek V3.2 medium | DeepSeek | 3.9 | 7.0 | 0/2 | 185.0s |