AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #10 | Gemini 3 PRO Preview medium | 3.0 | 8.4 | 0/1 | 0ms | |
| #18 | Qwen3.6 Plus medium | Qwen | 3.0 | 8.1 | 0/1 | 0ms |
| #47 | Hunter Alpha medium | OpenRouter | 3.0 | 6.7 | 0/1 | 0ms |
| #48 | Nemotron 3 Super medium | NVIDIA | 3.0 | 6.7 | 0/1 | 0ms |
| #67 | MiniMax M2.5 medium | Minimax | 3.0 | 5.7 | 0/1 | 0ms |
| #68 | Hunter Alpha none | OpenRouter | 3.0 | 5.7 | 0/1 | 0ms |
| #93 | Step 3.5 Flash none | Stepfun | 3.0 | 3.0 | 0/1 | 0ms |
| #85 | Mercury 2 none | Inception | 3.6 | 4.8 | 0/1 | 969ms |
| #75 | Grok 4.20 Beta none | X AI | 5.5 | 5.3 | 0/1 | 1.14s |
| #59 | Gemini 2.5 Flash none | 10.0 | 6.2 | 1/1 | 1.16s | |
| #80 | GPT-5.4 Mini none | OpenAI | 10.0 | 5.1 | 1/1 | 1.19s |
| #77 | Grok 4.20 none | X AI | 3.4 | 5.2 | 0/1 | 1.22s |
| #78 | Mistral Small 4 none | Mistral | 4.5 | 5.2 | 0/1 | 1.28s |
| #56 | Qwen3.5-Flash none | Qwen | 10.0 | 6.2 | 1/1 | 1.29s |
| #90 | GPT-5.4 Nano none | OpenAI | 7.1 | 4.5 | 0/1 | 1.43s |