AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Categorie AI BENCHY

Clasament Respectarea instrucțiunilor

Vezi ce modele AI se descurcă cel mai bine la Respectarea instrucțiunilor, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Timp de răspuns (mediu) ↓.

Modele afișate

15

Media pentru Scor Respectarea instrucțiunilor

8.5

Cel mai bun model

Kimi K2.5 10.0
Rang Model Companie Scor Respectarea instrucțiunilor Scor Teste corecte Timp de răspuns (mediu)
#52 Claude Sonnet 4.6 medium Anthropic 10.0 7.4 2/2 2.61s
#44 Gemini 3.1 Flash Lite medium Google 9.9 7.5 2/2 2.59s
#120 Mimo V2 PRO none Xiaomi 6.5 5.6 1/2 2.51s
#69 Claude Opus 4.6 medium Anthropic 10.0 7.0 2/2 2.43s
#134 GLM 5 Turbo none Z.ai 6.5 5.2 1/2 2.13s
#45 GPT-5.4 Mini medium OpenAI 9.8 7.5 2/2 2.13s
#112 GLM 5.1 none Z.ai 9.8 5.7 2/2 1.98s
#109 GLM 5V Turbo none Z.ai 6.5 5.8 1/2 1.97s
#77 Claude Sonnet 4.6 none Anthropic 6.5 6.8 1/2 1.96s
#118 Qwen3.6 27B none Qwen 6.2 5.6 1/2 1.92s
#40 Gemini 3.1 Flash Lite Preview medium Google 10.0 7.5 2/2 1.91s
#70 GPT-5.4 Nano medium OpenAI 9.8 7.0 2/2 1.88s
#3 Gemini 3.5 Flash low Google 9.9 9.4 2/2 1.86s
#153 Qwen3.6 35B A3B none Qwen 6.2 4.6 1/2 1.86s
#22 Step 3.7 Flash medium Stepfun 9.8 8.0 2/2 1.83s

Top modele după Scor Respectarea instrucțiunilor

Scor Respectarea instrucțiunilor vs cost total

Top modele după Timp de răspuns (mediu)