AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #59 | GLM 5V Turbo medium | Z.ai | 6.8 | 7.4 | 1/2 | 54.8s |
| #72 | Claude Sonnet 4.6 none | Anthropic | 6.8 | 7.0 | 1/2 | 6.73s |
| #77 | Gemma 4 31B none | 6.8 | 6.7 | 1/2 | 14.8s | |
| #78 | Gemini 3.1 Flash Lite minimal | 6.8 | 6.7 | 1/2 | 951ms | |
| #85 | Gemini 3.1 Flash Lite none | 6.8 | 6.6 | 1/2 | 1.13s | |
| #86 | GPT-5.5 none | OpenAI | 6.8 | 6.5 | 1/2 | 1.52s |
| #90 | Gemini 2.5 Flash none | 6.8 | 6.4 | 1/2 | 810ms | |
| #98 | Qwen3.5-Flash none | Qwen | 6.8 | 5.9 | 1/2 | 993ms |
| #99 | GLM 5V Turbo none | Z.ai | 6.8 | 5.9 | 1/2 | 3.77s |
| #104 | Qwen3.5-35B-A3B none | Qwen | 6.8 | 5.8 | 1/2 | 1.72s |
| #107 | Qwen3.6 27B none | Qwen | 6.8 | 5.8 | 1/2 | 5.75s |
| #110 | MiMo-V2-Pro none | Xiaomi | 6.8 | 5.7 | 1/2 | 2.65s |
| #114 | GPT-5.4 none | OpenAI | 6.8 | 5.6 | 1/2 | 1.99s |
| #128 | Kimi K2.5 none | Moonshot AI | 6.8 | 5.3 | 1/2 | 36.0s |
| #136 | MiMo-V2.5 none | Xiaomi | 6.8 | 5.0 | 1/2 | 3.74s |