AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #17 | Qwen3.6 Plus Preview medium | Qwen | 0.0 | 8.2 | 0/0 | 0ms |
| #20 | Gemini 3 PRO Preview medium | 3.0 | 8.1 | 0/2 | 0ms | |
| #34 | Step 3.5 Flash none | Stepfun | 3.0 | 7.8 | 0/1 | 0ms |
| #76 | Hunter Alpha medium | OpenRouter | 3.0 | 6.7 | 0/1 | 0ms |
| #112 | Hunter Alpha none | OpenRouter | 3.0 | 5.7 | 0/1 | 0ms |
| #153 | Granite 4.1 8B none | IBM Granite | 5.2 | 4.1 | 0/2 | 706ms |
| #90 | Gemini 2.5 Flash none | 6.8 | 6.4 | 1/2 | 810ms | |
| #146 | Mercury 2 none | Inception | 3.5 | 4.6 | 0/2 | 831ms |
| #78 | Gemini 3.1 Flash Lite minimal | 6.8 | 6.7 | 1/2 | 951ms | |
| #98 | Qwen3.5-Flash none | Qwen | 6.8 | 5.9 | 1/2 | 993ms |
| #137 | GPT-5.4 Mini none | OpenAI | 6.8 | 4.9 | 1/2 | 1.01s |
| #135 | Mistral Small 4 none | Mistral | 4.0 | 5.0 | 0/2 | 1.03s |
| #52 | Gemini 3.1 Flash Lite Preview none | 6.8 | 7.5 | 1/2 | 1.06s | |
| #141 | GPT-5.4 Nano none | OpenAI | 5.4 | 4.8 | 0/2 | 1.09s |
| #85 | Gemini 3.1 Flash Lite none | 6.8 | 6.6 | 1/2 | 1.13s |