AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Eșecuri pe categorii AI BENCHY

Programare: Nu a urmat instrucțiunile

Programare
Nu a urmat instrucțiunile

Vezi ce modele AI au cele mai mari șanse să întâmpine Nu a urmat instrucțiunile la Programare, ca să găsești mai repede punctele slabe. Sortează după: Teste corecte ↑.

Modele afișate

2

Eșecuri totale

2

Modelul cel mai afectat

Grok 4.1 Fast 1

Top modele după Număr de Nu a urmat instrucțiunile

Număr de Nu a urmat instrucțiunile vs Scor

Top modele după Timp de răspuns (mediu)

Top modele după Cost irosit estimat