AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Categorie AI BENCHY

Clasament Respectarea instrucțiunilor

Vezi ce modele AI se descurcă cel mai bine la Respectarea instrucțiunilor, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Metrică ↑.

Modele afișate

15

Media pentru Scor Respectarea instrucțiunilor

8.0

Cel mai bun model

Grok 4.1 Fast 3.0
Rang Model Companie Scor Respectarea instrucțiunilor Scor Teste corecte Timp de răspuns (mediu)
#59 Qwen3.5-Flash none Qwen 6.3 6.2 1/2 8.81s
#63 Qwen3.5-35B-A3B none Qwen 6.3 6.1 1/2 809ms
#86 GPT-5.4 Mini none OpenAI 6.3 5.1 1/2 728ms
#72 Hunter Alpha none OpenRouter 6.4 5.7 1/2 2.82s
#21 Gemini 3 Flash Preview none Google 6.4 8.1 1/2 1.58s
#33 GLM 5.1 medium Z.ai 6.4 7.8 1/2 7.47s
#97 Qwen3.5-9B medium Qwen 6.4 4.4 1/2 17.1s
#42 Claude Sonnet 4.6 none Anthropic 6.5 7.4 1/2 1.96s
#48 Gemma 4 31B none Google 6.5 6.9 1/2 2.84s
#55 MiMo-V2-Omni none Xiaomi 6.5 6.5 1/2 4.18s
#58 GLM 5V Turbo none Z.ai 6.5 6.2 1/2 1.97s
#65 MiMo-V2-Pro none Xiaomi 6.5 6.0 1/2 2.51s
#66 GPT-5.4 none OpenAI 6.5 5.9 1/2 1.07s
#69 Kimi K2.6 none Moonshot AI 6.5 5.8 1/2 1.64s
#74 GLM 4.7 Flash none Z.ai 6.5 5.6 1/2 888ms

Top modele după Scor Respectarea instrucțiunilor

Scor Respectarea instrucțiunilor vs cost total

Top modele după Timp de răspuns (mediu)