AI BENCHY
Comparer Graphiques Méthodologie
❤️ Made by XCS
Your ad here

Échecs par catégorie AI BENCHY

Astuces anti-IA
N'a pas suivi les instructions

Voyez quels modèles d'IA ont le plus de chances de rencontrer N'a pas suivi les instructions sur Astuces anti-IA, pour repérer plus vite les points faibles. Trier par: Temps de réponse (moy.) ↓.

Modèles affichés

12

Échecs totaux

12

Modèle le plus touché

MiniMax M2.5 1
Rang Modèle Entreprise Nombre de N'a pas suivi les instructions Score de catégorie Tests corrects Temps de réponse (moy.)
#43 MiniMax M2.5 medium Minimax 1 9.3 2/3 32.4s
#52 GLM 4.7 Flash medium Z.ai 1 4.0 1/3 27.1s
#39 gpt-oss-120b medium OpenAI 1 7.0 2/3 19.8s
#32 GPT-5 Mini medium OpenAI 1 7.0 2/3 16.5s
#50 Qwen3 Coder Next medium Qwen 1 1.3 0/3 15.3s
#27 GPT-5.2 medium OpenAI 1 7.0 2/3 14.3s
#19 GPT-5.3 Chat none OpenAI 1 7.3 2/3 4.72s
#48 Qwen3 Coder Next none Qwen 1 2.3 0/3 4.39s
#12 Gemini 3.1 Flash Lite Preview medium Google 1 9.0 2/3 2.53s
#53 Grok 4.1 Fast none X AI 1 1.3 0/3 1.73s
#36 Mercury 2 medium Inception 1 7.3 2/3 1.30s
#22 Gemini 3.1 Flash Lite Preview none Google 1 6.0 1/3 1.16s

Meilleurs modèles par Nombre de N'a pas suivi les instructions

Nombre de N'a pas suivi les instructions vs score moyen

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé