AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY श्रेणी

कोडिंग रैंकिंग

देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: मेट्रिक ↑.

दिखाए गए मॉडल

15

औसत कोडिंग स्कोर

6.1

सर्वश्रेष्ठ मॉडल

Qwen3.6 Plus Preview 0.0
रैंक मॉडल कंपनी कोडिंग स्कोर स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#10 Claude Opus 4.7 none Anthropic 10.0 8.9 1/1 2.84s
#14 Grok 4.20 Beta medium X AI 10.0 8.5 1/1 31.4s
#16 GPT-5.3-Codex medium OpenAI 10.0 8.3 2/2 18.5s
#18 GLM 5 medium Z.ai 10.0 8.2 2/2 89.5s
#19 Hy3 preview medium Tencent 10.0 8.1 1/1 31.4s
#22 Hy3 preview high Tencent 10.0 8.1 1/1 99.8s
#39 Hy3 preview low Tencent 10.0 7.7 1/1 27.9s
#51 Gemini 3.1 Flash Lite high Google 10.0 7.5 1/1 137.6s
#60 GPT-5.2 medium OpenAI 10.0 7.3 2/2 23.2s
#64 Ring-2.6-1T medium Inclusionai 10.0 7.2 1/1 59.6s
#65 Ring-2.6-1T none Inclusionai 10.0 7.2 1/1 143.8s
#68 GPT-5 Mini medium OpenAI 10.0 7.2 2/2 30.7s
#80 Grok Build 0.1 none X AI 10.0 6.6 1/1 21.4s
#84 Grok 4.20 Multi Agent Beta medium X AI 10.0 6.6 1/1 27.1s
#130 Ling-2.6-flash none Inclusionai 10.0 5.3 1/1 11.2s

कोडिंग स्कोर के अनुसार शीर्ष मॉडल

कोडिंग स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल