AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #46 | Qwen3.5 Plus 2026-02-15 none | Qwen | 6.3 | 6.8 | 0/1 | 3.63s |
| #39 | Claude Sonnet 4.6 none | Anthropic | 10.0 | 7.4 | 1/1 | 3.67s |
| #62 | MiMo-V2-Pro none | Xiaomi | 10.0 | 6.0 | 1/1 | 3.82s |
| #73 | GLM 5 Turbo none | Z.ai | 5.3 | 5.5 | 0/1 | 3.93s |
| #15 | Gemini 3.1 Flash Lite Preview medium | 10.0 | 8.2 | 1/1 | 4.34s | |
| #58 | Seed-2.0-Lite none | Bytedance Seed | 10.0 | 6.2 | 1/1 | 4.61s |
| #55 | GLM 5V Turbo none | Z.ai | 10.0 | 6.2 | 1/1 | 5.30s |
| #70 | GLM 4.7 Flash none | Z.ai | 6.4 | 5.6 | 0/1 | 5.57s |
| #84 | Qwen3.5-9B none | Qwen | 5.2 | 4.8 | 0/1 | 5.69s |
| #3 | Gemini 3 Flash Preview low | 10.0 | 8.8 | 1/1 | 6.94s | |
| #57 | Gemma 4 26B A4B none | 4.7 | 6.2 | 0/1 | 7.07s | |
| #61 | DeepSeek V3.2 none | DeepSeek | 2.4 | 6.1 | 0/1 | 7.63s |
| #41 | GPT-5.4 Mini medium | OpenAI | 10.0 | 7.3 | 1/1 | 7.76s |
| #50 | GLM 5 none | Z.ai | 5.6 | 6.6 | 0/1 | 8.84s |
| #5 | GPT-5.3-Codex medium | OpenAI | 10.0 | 8.6 | 1/1 | 8.95s |