AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #72 | Claude Sonnet 4.6 none | Anthropic | 6.8 | 7.0 | 1/2 | 6.73s |
| #77 | Gemma 4 31B none | 6.8 | 6.7 | 1/2 | 14.8s | |
| #78 | Gemini 3.1 Flash Lite minimal | 6.8 | 6.7 | 1/2 | 951ms | |
| #81 | Qwen3.6 27B medium | Qwen | 6.6 | 6.6 | 1/2 | 165.4s |
| #85 | Gemini 3.1 Flash Lite none | 6.8 | 6.6 | 1/2 | 1.13s | |
| #86 | GPT-5.5 none | OpenAI | 6.8 | 6.5 | 1/2 | 1.52s |
| #87 | Mercury 2 medium | Inception | 7.2 | 6.5 | 1/2 | 2.29s |
| #90 | Gemini 2.5 Flash none | 6.8 | 6.4 | 1/2 | 810ms | |
| #98 | Qwen3.5-Flash none | Qwen | 6.8 | 5.9 | 1/2 | 993ms |
| #99 | GLM 5V Turbo none | Z.ai | 6.8 | 5.9 | 1/2 | 3.77s |
| #100 | Seed-2.0-Lite none | Bytedance Seed | 6.8 | 5.9 | 1/2 | 2.95s |
| #101 | Owl Alpha medium | Openrouter | 6.6 | 5.8 | 1/2 | 19.1s |
| #104 | Qwen3.5-35B-A3B none | Qwen | 6.8 | 5.8 | 1/2 | 1.72s |
| #106 | Qwen3.5-27B none | Qwen | 7.3 | 5.8 | 1/2 | 1.98s |
| #107 | Qwen3.6 27B none | Qwen | 6.8 | 5.8 | 1/2 | 5.75s |