AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Categorie AI BENCHY

Clasament Respectarea instrucțiunilor

Vezi ce modele AI se descurcă cel mai bine la Respectarea instrucțiunilor, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Timp de răspuns (mediu) ↓.

Modele afișate

15

Media pentru Scor Respectarea instrucțiunilor

8.5

Cel mai bun model

Kimi K2.5 10.0
Rang Model Companie Scor Respectarea instrucțiunilor Scor Teste corecte Timp de răspuns (mediu)
#76 Kimi K2.5 medium Moonshot AI 10.0 6.8 2/2 92.5s
#12 Gemini 3.1 Flash Lite Preview high Google 9.8 8.6 2/2 64.0s
#49 Qwen3.5-Flash medium Qwen 10.0 7.4 2/2 63.5s
#103 DeepSeek V4 Pro high DeepSeek 10.0 6.0 2/2 41.2s
#78 Qwen3.6 27B medium Qwen 10.0 6.8 2/2 38.0s
#72 DeepSeek V3.2 medium DeepSeek 10.0 7.0 2/2 35.8s
#82 Hy3 preview high Tencent 10.0 6.6 2/2 34.4s
#25 Qwen3.5 Plus 2026-02-15 medium Qwen 10.0 7.9 2/2 31.9s
#96 Ring-2.6-1T none Inclusionai 9.8 6.2 2/2 27.4s
#66 Qwen3.5-35B-A3B medium Qwen 10.0 7.1 2/2 24.4s
#14 Qwen3.6 Max Preview medium Qwen 10.0 8.5 2/2 24.3s
#53 Gemini 3.1 Flash Lite high Google 7.3 7.3 1/2 23.3s
#36 Qwen3.5 Plus 2026-04-20 medium Qwen 10.0 7.6 2/2 20.2s
#30 Qwen3.5-27B medium Qwen 10.0 7.8 2/2 19.7s
#38 Grok 4.3 medium X AI 9.8 7.6 2/2 18.6s

Top modele după Scor Respectarea instrucțiunilor

Scor Respectarea instrucțiunilor vs cost total

Top modele după Timp de răspuns (mediu)