AI BENCHY
Your ad here

AI BENCHY श्रेणी

कोडिंग रैंकिंग

देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

15

औसत कोडिंग स्कोर

7.2

सर्वश्रेष्ठ मॉडल

Seed-2.0-Mini 10.0
रैंक मॉडल कंपनी कोडिंग स्कोर स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#32 MiMo-V2-Omni medium Xiaomi 4.0 7.7 0/1 68.5s
#21 MiMo-V2-Pro medium Xiaomi 10.0 8.1 1/1 52.1s
#30 Qwen3.5-Flash medium Qwen 4.7 7.8 0/1 45.7s
#54 GPT-5 Nano medium OpenAI 6.7 6.3 0/1 40.7s
#74 Trinity Large Preview none Arcee AI 6.3 5.3 0/1 39.5s
#72 Kimi K2.5 none Moonshot AI 10.0 5.5 1/1 38.8s
#24 Claude Sonnet 4.6 medium Anthropic 10.0 8.0 1/1 35.8s
#23 Grok 4.20 Beta medium X AI 10.0 8.0 1/1 31.4s
#69 Mistral Small 4 medium Mistral 6.7 5.7 0/1 30.5s
#53 Grok 4.20 Multi Agent Beta medium X AI 10.0 6.4 1/1 27.1s
#65 gpt-oss-120b medium OpenAI 4.3 5.8 0/1 26.3s
#45 Gemma 4 31B none Google 10.0 6.9 1/1 26.1s
#44 Grok 4.20 medium X AI 4.3 7.0 0/1 24.3s
#49 Grok 4.1 Fast medium X AI 2.3 6.7 0/1 23.6s
#42 GPT-5 Mini medium OpenAI 10.0 7.0 1/1 23.2s

कोडिंग स्कोर के अनुसार शीर्ष मॉडल

कोडिंग स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल