AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY श्रेणी

कोडिंग रैंकिंग

देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

14

औसत कोडिंग स्कोर

7.2

सर्वश्रेष्ठ मॉडल

Seed-2.0-Mini 10.0
रैंक मॉडल कंपनी कोडिंग स्कोर स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#56 Qwen3.5-Flash none Qwen 10.0 6.2 1/1 1.29s
#78 Mistral Small 4 none Mistral 4.5 5.2 0/1 1.28s
#77 Grok 4.20 none X AI 3.4 5.2 0/1 1.22s
#80 GPT-5.4 Mini none OpenAI 10.0 5.1 1/1 1.19s
#59 Gemini 2.5 Flash none Google 10.0 6.2 1/1 1.16s
#75 Grok 4.20 Beta none X AI 5.5 5.3 0/1 1.14s
#85 Mercury 2 none Inception 3.6 4.8 0/1 969ms
#10 Gemini 3 PRO Preview medium Google 3.0 8.4 0/1 0ms
#18 Qwen3.6 Plus medium Qwen 3.0 8.1 0/1 0ms
#47 Hunter Alpha medium OpenRouter 3.0 6.7 0/1 0ms
#48 Nemotron 3 Super medium NVIDIA 3.0 6.7 0/1 0ms
#67 MiniMax M2.5 medium Minimax 3.0 5.7 0/1 0ms
#68 Hunter Alpha none OpenRouter 3.0 5.7 0/1 0ms
#93 Step 3.5 Flash none Stepfun 3.0 3.0 0/1 0ms

कोडिंग स्कोर के अनुसार शीर्ष मॉडल

कोडिंग स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल