AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #10 | Claude Opus 4.7 none | Anthropic | 10.0 | 8.9 | 1/1 | 2.84s |
| #14 | Grok 4.20 Beta medium | X AI | 10.0 | 8.5 | 1/1 | 31.4s |
| #16 | GPT-5.3-Codex medium | OpenAI | 10.0 | 8.3 | 2/2 | 18.5s |
| #18 | GLM 5 medium | Z.ai | 10.0 | 8.2 | 2/2 | 89.5s |
| #19 | Hy3 preview medium | Tencent | 10.0 | 8.1 | 1/1 | 31.4s |
| #22 | Hy3 preview high | Tencent | 10.0 | 8.1 | 1/1 | 99.8s |
| #39 | Hy3 preview low | Tencent | 10.0 | 7.7 | 1/1 | 27.9s |
| #51 | Gemini 3.1 Flash Lite high | 10.0 | 7.5 | 1/1 | 137.6s | |
| #60 | GPT-5.2 medium | OpenAI | 10.0 | 7.3 | 2/2 | 23.2s |
| #64 | Ring-2.6-1T medium | Inclusionai | 10.0 | 7.2 | 1/1 | 59.6s |
| #65 | Ring-2.6-1T none | Inclusionai | 10.0 | 7.2 | 1/1 | 143.8s |
| #68 | GPT-5 Mini medium | OpenAI | 10.0 | 7.2 | 2/2 | 30.7s |
| #80 | Grok Build 0.1 none | X AI | 10.0 | 6.6 | 1/1 | 21.4s |
| #84 | Grok 4.20 Multi Agent Beta medium | X AI | 10.0 | 6.6 | 1/1 | 27.1s |
| #130 | Ling-2.6-flash none | Inclusionai | 10.0 | 5.3 | 1/1 | 11.2s |