AI BENCHY
Comparer Graphiques Méthodologie
❤️ Made by XCS
Your ad here

Échecs par catégorie AI BENCHY

Suivi des instructions
N'a pas suivi les instructions

Voyez quels modèles d'IA ont le plus de chances de rencontrer N'a pas suivi les instructions sur Suivi des instructions, pour repérer plus vite les points faibles. Trier par: Temps de réponse (moy.) ↓.

Modèles affichés

9

Échecs totaux

9

Modèle le plus touché

Gemini 3.1 Flash Lite Preview 1
Rang Modèle Entreprise Nombre de N'a pas suivi les instructions Score de catégorie Tests corrects Temps de réponse (moy.)
#8 Gemini 3.1 Flash Lite Preview high Google 1 9.0 1/2 70.1s
#32 GPT-5 Mini medium OpenAI 1 7.5 1/2 15.7s
#34 GPT-5 Nano medium OpenAI 1 9.0 1/2 11.9s
#50 Qwen3 Coder Next medium Qwen 1 4.5 0/2 7.34s
#30 Grok 4.1 Fast medium X AI 1 5.5 1/2 5.30s
#13 Step 3.5 Flash medium Stepfun 1 9.0 1/2 4.98s
#43 MiniMax M2.5 medium Minimax 1 8.0 1/2 4.64s
#47 GPT-4o-mini none OpenAI 1 4.5 0/2 1.27s
#45 Trinity Large Preview none Arcee AI 1 3.5 0/2 1.09s

Meilleurs modèles par Nombre de N'a pas suivi les instructions

Nombre de N'a pas suivi les instructions vs score moyen

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé