AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Categorie AI BENCHY

Clasament Respectarea instrucțiunilor

Vezi ce modele AI se descurcă cel mai bine la Respectarea instrucțiunilor, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Teste corecte ↓.

Modele afișate

10

Media pentru Scor Respectarea instrucțiunilor

8.1

Rang Model Companie Scor Respectarea instrucțiunilor Scor Teste corecte Timp de răspuns (mediu)
#93 Grok 4.20 Beta none X AI 4.8 5.3 0/2 687ms
#94 MiniMax M2.7 medium Minimax 3.7 5.3 0/2 12.6s
#96 Grok 4.20 none X AI 4.8 5.2 0/2 455ms
#101 Qwen3 Coder Next none Qwen 4.8 5.1 0/2 7.71s
#103 Nemotron 3 Super none NVIDIA 4.9 5.1 0/2 1.50s
#104 GPT-4o-mini none OpenAI 4.8 4.9 0/2 1.27s
#107 Qwen3 Coder Next medium Qwen 4.8 4.7 0/2 7.34s
#111 Grok 4.1 Fast none X AI 3.0 4.5 0/2 923ms
#113 GPT-5.4 Nano none OpenAI 5.0 4.5 0/2 787ms
#115 LFM2-24B-A2B none Liquid 4.8 4.1 0/2 1.09s

Top modele după Scor Respectarea instrucțiunilor

Scor Respectarea instrucțiunilor vs cost total

Top modele după Timp de răspuns (mediu)