AI BENCHY
Your ad here

Échecs AI BENCHY

Échecs Mauvaise réponse

Voyez quels modèles d'IA rencontrent le plus souvent Mauvaise réponse, pour repérer les risques de fiabilité avant de choisir. Trier par: Score ↓.

Modèles affichés

7

Échecs totaux

572

Modèle le plus touché

Gemini 3.1 Pro Preview 1
Rang Modèle Entreprise Nombre de Mauvaise réponse Score Tests corrects Temps de réponse (moy.)
#92 Qwen3 Coder Next medium Qwen 9 4.7 3/18 10.8s
#93 GLM 4.7 Flash medium Z.ai 8 4.6 4/18 32.3s
#94 MiMo-V2-Flash none Xiaomi 12 4.5 3/18 2.79s
#95 Grok 4.1 Fast none X AI 13 4.5 3/18 1.76s
#96 GPT-5.4 Nano none OpenAI 13 4.5 2/18 1.40s
#97 Qwen3.5-9B medium Qwen 1 4.4 3/18 73.6s
#98 LFM2-24B-A2B none Liquid 9 4.1 1/16 811ms

Meilleurs modèles par Nombre de Mauvaise réponse

Nombre de Mauvaise réponse vs Score

Meilleurs modèles par Temps de réponse (moy.)