AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: मेट्रिक ↑.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #21 | MiMo-V2-Pro medium | Xiaomi | 10.0 | 8.1 | 1/1 | 52.1s |
| #23 | Grok 4.20 Beta medium | X AI | 10.0 | 8.0 | 1/1 | 31.4s |
| #24 | Claude Sonnet 4.6 medium | Anthropic | 10.0 | 8.0 | 1/1 | 35.8s |
| #26 | GPT-5.2 Chat none | OpenAI | 10.0 | 7.9 | 1/1 | 8.97s |
| #27 | Gemini 3.1 Flash Lite Preview none | 10.0 | 7.9 | 1/1 | 1.47s | |
| #29 | GLM 5V Turbo medium | Z.ai | 10.0 | 7.8 | 1/1 | 13.8s |
| #33 | GPT-5.3 Chat none | OpenAI | 10.0 | 7.7 | 1/1 | 9.32s |
| #34 | Claude Opus 4.6 medium | Anthropic | 10.0 | 7.6 | 1/1 | 23.1s |
| #35 | GPT-5.4 Nano medium | OpenAI | 10.0 | 7.6 | 1/1 | 13.4s |
| #36 | Seed-2.0-Mini medium | Bytedance Seed | 10.0 | 7.5 | 1/1 | 197.3s |
| #37 | GPT-5.2 medium | OpenAI | 10.0 | 7.5 | 1/1 | 15.1s |
| #39 | Claude Sonnet 4.6 none | Anthropic | 10.0 | 7.4 | 1/1 | 3.67s |
| #40 | Qwen3.5-35B-A3B medium | Qwen | 10.0 | 7.4 | 1/1 | 79.1s |
| #41 | GPT-5.4 Mini medium | OpenAI | 10.0 | 7.3 | 1/1 | 7.76s |
| #42 | GPT-5 Mini medium | OpenAI | 10.0 | 7.0 | 1/1 | 23.2s |