AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: मेट्रिक ↑.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #27 | Qwen3.7 Max none | Qwen | 6.8 | 7.9 | 1/2 | 1.39s |
| #36 | Gemini 3.1 Flash Lite Preview medium | 6.8 | 7.7 | 1/2 | 3.98s | |
| #37 | Gemini 3.1 Flash Lite medium | 6.8 | 7.7 | 1/2 | 3.59s | |
| #41 | Gemini 3 Flash Preview none | 6.8 | 7.7 | 1/2 | 2.19s | |
| #44 | DeepSeek V4 Flash high | DeepSeek | 6.8 | 7.6 | 1/2 | 58.1s |
| #46 | Gemini 3.1 Flash Lite Preview low | 6.8 | 7.6 | 1/2 | 1.56s | |
| #52 | Gemini 3.1 Flash Lite Preview none | 6.8 | 7.5 | 1/2 | 1.06s | |
| #53 | Gemini 3.1 Flash Lite low | 6.8 | 7.4 | 1/2 | 1.71s | |
| #59 | GLM 5V Turbo medium | Z.ai | 6.8 | 7.4 | 1/2 | 54.8s |
| #72 | Claude Sonnet 4.6 none | Anthropic | 6.8 | 7.0 | 1/2 | 6.73s |
| #77 | Gemma 4 31B none | 6.8 | 6.7 | 1/2 | 14.8s | |
| #78 | Gemini 3.1 Flash Lite minimal | 6.8 | 6.7 | 1/2 | 951ms | |
| #85 | Gemini 3.1 Flash Lite none | 6.8 | 6.6 | 1/2 | 1.13s | |
| #86 | GPT-5.5 none | OpenAI | 6.8 | 6.5 | 1/2 | 1.52s |
| #90 | Gemini 2.5 Flash none | 6.8 | 6.4 | 1/2 | 810ms |