AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Categorie AI BENCHY

Clasament Specific domeniului

Vezi ce modele AI se descurcă cel mai bine la Specific domeniului, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Timp de răspuns (mediu) ↓.

Modele afișate

15

Media pentru Scor Specific domeniului

4.8

Cel mai bun model

MiniMax M2.5 2.9
Rang Model Companie Scor Specific domeniului Scor Teste corecte Timp de răspuns (mediu)
#5 Gemini 3 Flash Preview low Google 5.3 8.8 1/3 8.05s
#12 Gemini 3 PRO Preview medium Google 5.3 8.4 1/3 7.01s
#54 Mercury 2 medium Inception 2.9 6.5 0/3 6.48s
#88 Nemotron 3 Super none NVIDIA 3.6 5.1 0/3 6.23s
#73 Mistral Small 4 medium Mistral 5.3 5.7 1/3 6.11s
#23 MiMo-V2-Pro medium Xiaomi 5.3 8.1 1/3 6.00s
#76 Kimi K2.5 none Moonshot AI 5.3 5.5 1/3 4.38s
#17 Gemini 3.1 Flash Lite Preview medium Google 3.0 8.2 0/3 4.21s
#42 Claude Sonnet 4.6 none Anthropic 7.7 7.4 2/3 3.54s
#48 Gemma 4 31B none Google 7.7 6.9 2/3 3.22s
#60 Gemma 4 26B A4B none Google 3.6 6.2 0/3 2.49s
#22 Gemini 3.1 Flash Lite Preview low Google 5.3 8.1 1/3 2.36s
#72 Hunter Alpha none OpenRouter 5.3 5.7 1/3 2.33s
#53 GLM 5 none Z.ai 3.0 6.6 0/3 2.24s
#58 GLM 5V Turbo none Z.ai 5.3 6.2 1/3 2.09s

Top modele după Scor Specific domeniului

Scor Specific domeniului vs cost total

Top modele după Timp de răspuns (mediu)