AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY श्रेणी

डोमेन-विशिष्ट रैंकिंग

देखें कि डोमेन-विशिष्ट में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।

दिखाए गए मॉडल

15

औसत डोमेन-विशिष्ट स्कोर

4.8

सर्वश्रेष्ठ मॉडल

Gemini 3 Flash Preview 10.0
रैंक मॉडल कंपनी डोमेन-विशिष्ट स्कोर स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#1 Gemini 3 Flash Preview medium Google 10.0 9.8 3/3 15.3s
#32 Gemini 3.5 Flash minimal Google 10.0 7.7 3/3 899ms
#83 Step 3.5 Flash none Stepfun 10.0 6.6 1/1 34.5s
#3 Gemini 3.5 Flash low Google 7.7 9.4 2/3 3.39s
#4 Gemini 3.1 Pro Preview medium Google 7.7 9.4 2/3 32.7s
#7 Gemini 3.5 Flash medium Google 7.7 9.0 2/3 5.24s
#8 Claude Opus 4.7 none Anthropic 7.7 8.9 2/3 1.19s
#11 Claude Opus 4.7 medium Anthropic 7.7 8.7 2/3 1.17s
#22 Step 3.7 Flash medium Stepfun 7.7 8.0 2/3 48.3s
#27 Gemma 4 31B medium Google 7.7 7.8 2/3 38.5s
#34 Qwen3.7 Max none Qwen 7.7 7.7 2/3 975ms
#48 Gemini 3 Flash Preview none Google 7.7 7.4 2/3 963ms
#74 Qwen3.6 Max Preview none Qwen 7.7 6.9 2/3 1.22s
#77 Claude Sonnet 4.6 none Anthropic 7.7 6.8 2/3 3.54s
#85 Gemma 4 31B none Google 7.7 6.5 2/3 3.22s

डोमेन-विशिष्ट स्कोर के अनुसार शीर्ष मॉडल

डोमेन-विशिष्ट स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल