AI BENCHY
Your ad here

AI BENCHY श्रेणी

डोमेन-विशिष्ट रैंकिंग

देखें कि डोमेन-विशिष्ट में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.

दिखाए गए मॉडल

15

औसत डोमेन-विशिष्ट स्कोर

4.8

सर्वश्रेष्ठ मॉडल

Gemini 3 Flash Preview 10.0
रैंक मॉडल कंपनी डोमेन-विशिष्ट स्कोर स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#72 Hunter Alpha none OpenRouter 5.3 5.7 1/3 2.33s
#73 Mistral Small 4 medium Mistral 5.3 5.7 1/3 6.11s
#76 Kimi K2.5 none Moonshot AI 5.3 5.5 1/3 4.38s
#77 GLM 5 Turbo none Z.ai 5.3 5.5 1/3 1.97s
#78 Trinity Large Preview none Arcee AI 5.3 5.3 1/3 877ms
#83 Mistral Small 4 none Mistral 5.3 5.2 1/3 367ms
#87 Qwen3 Coder Next none Qwen 5.3 5.1 1/3 962ms
#91 Mercury 2 none Inception 5.3 4.8 1/3 534ms
#92 Qwen3 Coder Next medium Qwen 5.3 4.7 1/3 638ms
#94 MiMo-V2-Flash none Xiaomi 5.3 4.5 1/3 564ms
#95 Grok 4.1 Fast none X AI 5.9 4.5 1/3 1.06s
#98 LFM2-24B-A2B none Liquid 5.9 4.1 1/3 287ms
#9 Qwen3.6 Plus Preview medium Qwen 3.0 8.5 0/3 22.1s
#13 GLM 5 medium Z.ai 3.5 8.4 0/3 0ms
#17 Gemini 3.1 Flash Lite Preview medium Google 3.0 8.2 0/3 4.21s

डोमेन-विशिष्ट स्कोर के अनुसार शीर्ष मॉडल

डोमेन-विशिष्ट स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल