AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Categorie AI BENCHY

Clasament Respectarea instrucțiunilor

Vezi ce modele AI se descurcă cel mai bine la Respectarea instrucțiunilor, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Timp de răspuns (mediu) ↓.

Modele afișate

15

Media pentru Scor Respectarea instrucțiunilor

8.5

Cel mai bun model

Kimi K2.5 10.0
Rang Model Companie Scor Respectarea instrucțiunilor Scor Teste corecte Timp de răspuns (mediu)
#56 MiMo-V2.5 medium Xiaomi 9.9 7.3 2/2 1.80s
#107 Laguna Xs.2 medium Poolside 10.0 5.8 2/2 1.68s
#95 Qwen3.5 Plus 2026-02-15 none Qwen 10.0 6.3 2/2 1.67s
#124 Kimi K2.6 none Moonshot AI 6.5 5.5 1/2 1.64s
#57 Step 3.7 Flash low Stepfun 9.8 7.3 2/2 1.58s
#48 Gemini 3 Flash Preview none Google 6.4 7.4 1/2 1.58s
#11 Claude Opus 4.7 medium Anthropic 10.0 8.7 2/2 1.57s
#61 Gemini 3.1 Flash Lite low Google 10.0 7.2 2/2 1.52s
#133 DeepSeek V3.2 none DeepSeek 10.0 5.2 2/2 1.52s
#71 Step 3.7 Flash high Stepfun 9.8 7.0 2/2 1.52s
#50 Gemini 3.1 Flash Lite Preview low Google 10.0 7.4 2/2 1.49s
#98 GLM 5 none Z.ai 10.0 6.1 2/2 1.48s
#104 Nemotron 3 Ultra 550b A55b none NVIDIA 10.0 6.0 2/2 1.46s
#8 Claude Opus 4.7 none Anthropic 10.0 8.9 2/2 1.46s
#74 Qwen3.6 Max Preview none Qwen 9.8 6.9 2/2 1.40s

Top modele după Scor Respectarea instrucțiunilor

Scor Respectarea instrucțiunilor vs cost total

Top modele după Timp de răspuns (mediu)