AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #12 | Gemma 4 31B medium | 4.7 | 8.3 | 0/1 | 71.0s | |
| #17 | Qwen3.5-122B-A10B medium | Qwen | 4.7 | 8.1 | 0/1 | 71.0s |
| #4 | Seed-2.0-Lite medium | Bytedance Seed | 10.0 | 8.6 | 1/1 | 74.5s |
| #11 | GLM 5 medium | Z.ai | 10.0 | 8.4 | 1/1 | 79.1s |
| #40 | Qwen3.5-35B-A3B medium | Qwen | 10.0 | 7.4 | 1/1 | 79.1s |
| #1 | Gemini 3 Flash Preview medium | 10.0 | 10.0 | 1/1 | 79.7s | |
| #76 | MiniMax M2.7 medium | Minimax | 10.0 | 5.3 | 1/1 | 91.3s |
| #31 | GLM 5.1 medium | Z.ai | 4.7 | 7.8 | 0/1 | 118.5s |
| #6 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 10.0 | 8.5 | 1/1 | 120.9s |
| #91 | Qwen3.5-9B medium | Qwen | 2.6 | 4.4 | 0/1 | 135.6s |
| #22 | Gemma 4 26B A4B medium | 2.8 | 8.0 | 0/1 | 147.5s | |
| #43 | Kimi K2.5 medium | Moonshot AI | 4.7 | 7.0 | 0/1 | 150.8s |
| #25 | DeepSeek V3.2 medium | DeepSeek | 4.7 | 8.0 | 0/1 | 180.9s |
| #36 | Seed-2.0-Mini medium | Bytedance Seed | 10.0 | 7.5 | 1/1 | 197.3s |