AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: मेट्रिक ↑.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #94 | GPT-5 Nano medium | OpenAI | 5.4 | 6.1 | 0/2 | 47.8s |
| #95 | DeepSeek V4 Pro none | DeepSeek | 5.4 | 6.0 | 0/2 | 8.27s |
| #141 | GPT-5.4 Nano none | OpenAI | 5.4 | 4.8 | 0/2 | 1.09s |
| #105 | Grok 4.20 Beta none | X AI | 5.5 | 5.8 | 0/1 | 1.14s |
| #148 | Ling-2.6-1T none | Inclusionai | 5.5 | 4.5 | 0/1 | 10.6s |
| #82 | Laguna Xs.2 medium | Poolside | 6.3 | 6.6 | 0/1 | 14.4s |
| #57 | Kimi K2.6 medium | Moonshot AI | 6.5 | 7.4 | 1/2 | 118.2s |
| #63 | Qwen3.5-35B-A3B medium | Qwen | 6.5 | 7.3 | 1/2 | 244.5s |
| #32 | Qwen3.6 35B A3B medium | Qwen | 6.6 | 7.8 | 1/2 | 59.3s |
| #81 | Qwen3.6 27B medium | Qwen | 6.6 | 6.6 | 1/2 | 165.4s |
| #38 | Gemini 2.5 Flash medium | 6.6 | 7.7 | 1/2 | 54.6s | |
| #101 | Owl Alpha medium | Openrouter | 6.6 | 5.8 | 1/2 | 19.1s |
| #117 | Qwen3.6 Flash none | Qwen | 6.6 | 5.5 | 1/2 | 2.34s |
| #123 | MiniMax M2.7 medium | Minimax | 6.7 | 5.4 | 1/2 | 54.7s |
| #3 | Gemini 3.5 Flash low | 6.8 | 9.3 | 1/2 | 5.54s |