AI BENCHY
Advertise here

Échecs par catégorie AI BENCHY

Astuces anti-IA : N'a pas suivi les instructions

Astuces anti-IA
N'a pas suivi les instructions

Voyez quels modèles d'IA ont le plus de chances de rencontrer N'a pas suivi les instructions sur Astuces anti-IA, pour repérer plus vite les points faibles. Trier par: Nombre d'échecs ↑.

Modèles affichés

15

Échecs totaux

30

Modèle le plus touché

Step 3.7 Flash 1
Rang Modèle Entreprise Nombre de N'a pas suivi les instructions Score de catégorie Tests corrects Temps de réponse (moy.)
#22 Step 3.7 Flash medium Stepfun 1 8.7 3/4 9.65s
#40 Gemini 3.1 Flash Lite Preview medium Google 1 9.1 3/4 2.33s
#42 GPT-5.2 medium OpenAI 1 6.5 2/4 7.81s
#44 Gemini 3.1 Flash Lite medium Google 1 9.1 3/4 2.39s
#54 GPT-5 Mini medium OpenAI 1 7.1 2/4 13.9s
#58 Gemini 3.1 Flash Lite Preview none Google 1 7.5 2/4 1.04s
#59 GLM 5V Turbo medium Z.ai 1 7.2 2/4 10.8s
#60 Kimi K2.6 medium Moonshot AI 1 7.0 2/4 11.6s
#63 GPT-5.3 Chat none OpenAI 1 6.7 2/4 3.86s
#67 MiniMax M3 medium Minimax 1 5.5 1/4 14.9s
#81 Mercury 2 medium Inception 1 6.9 2/4 1.12s
#96 Ring-2.6-1T none Inclusionai 1 9.2 3/4 43.3s
#99 gpt-oss-120b medium OpenAI 1 6.7 2/4 10.2s
#101 Mimo V2 Omni none Xiaomi 1 3.6 0/4 1.63s
#113 DeepSeek V4 Pro none DeepSeek 1 3.5 0/4 14.0s

Meilleurs modèles par Nombre de N'a pas suivi les instructions

Nombre de N'a pas suivi les instructions vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé