AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Échecs par catégorie AI BENCHY

Astuces anti-IA : N'a pas suivi les instructions

Astuces anti-IA
N'a pas suivi les instructions

Voyez quels modèles d'IA ont le plus de chances de rencontrer N'a pas suivi les instructions sur Astuces anti-IA, pour repérer plus vite les points faibles. Trier par: Tests corrects ↓.

Modèles affichés

15

Échecs totaux

17

Modèle le plus touché

Gemini 3.1 Flash Lite Preview 1
Rang Modèle Entreprise Nombre de N'a pas suivi les instructions Score de catégorie Tests corrects Temps de réponse (moy.)
#17 Gemini 3.1 Flash Lite Preview medium Google 1 9.1 3/4 2.33s
#29 Gemini 3.1 Flash Lite Preview none Google 1 7.5 2/4 1.04s
#31 GLM 5V Turbo medium Z.ai 1 7.2 2/4 10.8s
#34 Kimi K2.6 medium Moonshot AI 1 7.0 2/4 11.6s
#36 GPT-5.3 Chat none OpenAI 1 6.7 2/4 3.86s
#40 GPT-5.2 medium OpenAI 1 6.5 2/4 7.81s
#45 GPT-5 Mini medium OpenAI 1 7.1 2/4 13.9s
#54 Mercury 2 medium Inception 1 6.9 2/4 1.12s
#68 gpt-oss-120b medium OpenAI 1 6.7 2/4 10.2s
#71 MiniMax M2.5 medium Minimax 1 7.9 2/4 20.8s
#80 MiniMax M2.7 medium Minimax 1 7.9 2/4 40.3s
#84 gpt-oss-120b none OpenAI 1 6.6 2/4 6.03s
#85 Elephant none Openrouter 1 6.6 2/4 963ms
#93 GLM 4.7 Flash medium Z.ai 1 4.7 1/4 15.0s
#87 Qwen3 Coder Next none Qwen 1 3.6 0/4 3.31s

Meilleurs modèles par Nombre de N'a pas suivi les instructions

Nombre de N'a pas suivi les instructions vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé