AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #147 | Hy3 preview none | Tencent | 2.3 | 4.6 | 0/1 | 4.56s |
| #148 | Ling-2.6-1T none | Inclusionai | 5.5 | 4.5 | 0/1 | 10.6s |
| #149 | GLM 4.7 Flash medium | Z.ai | 3.4 | 4.5 | 0/2 | 55.3s |
| #150 | Grok 4.1 Fast none | X AI | 5.3 | 4.4 | 0/1 | 1.79s |
| #151 | Qwen3.5-9B medium | Qwen | 2.8 | 4.2 | 0/2 | 135.6s |
| #153 | Granite 4.1 8B none | IBM Granite | 5.2 | 4.1 | 0/2 | 706ms |
| #1 | Gemini 3 Flash Preview medium | 7.9 | 9.8 | 1/2 | 96.0s | |
| #3 | Gemini 3.5 Flash low | 6.8 | 9.3 | 1/2 | 5.54s | |
| #4 | Gemini 3.1 Pro Preview medium | 7.0 | 9.3 | 1/2 | 54.3s | |
| #6 | Gemini 3.5 Flash medium | 6.8 | 9.0 | 1/2 | 9.91s | |
| #9 | Gemini 3.5 Flash none | 8.2 | 8.9 | 1/2 | 39.6s | |
| #11 | GPT-5.5 medium | OpenAI | 8.2 | 8.7 | 1/2 | 69.7s |
| #12 | Gemini 3 Flash Preview low | 7.3 | 8.6 | 1/2 | 6.66s | |
| #15 | Qwen3.6 Max Preview medium | Qwen | 8.2 | 8.4 | 1/2 | 178.0s |
| #21 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 7.6 | 8.1 | 1/2 | 193.8s |