AI BENCHY
Comparer Graphiques Méthodologie
❤️ Made by XCS
Your ad here

Échecs par catégorie AI BENCHY

Intelligence générale
Mauvaise réponse

Voyez quels modèles d'IA ont le plus de chances de rencontrer Mauvaise réponse sur Intelligence générale, pour repérer plus vite les points faibles. Trier par: Tests corrects ↓.

Modèles affichés

6

Échecs totaux

6

Modèle le plus touché

Qwen3.5 Plus 2026-02-15 1
Rang Modèle Entreprise Nombre de Mauvaise réponse Score de catégorie Tests corrects Temps de réponse (moy.)
#29 Qwen3.5 Plus 2026-02-15 none Qwen 1 4.0 0/1 2.26s
#38 Gemini 2.5 Flash none Google 1 5.0 0/1 615ms
#44 GPT-5.4 none OpenAI 1 3.0 0/1 1.78s
#47 GPT-4o-mini none OpenAI 1 3.0 0/1 909ms
#49 GLM 4.7 Flash none Z.ai 1 3.0 0/1 1.59s
#52 GLM 4.7 Flash medium Z.ai 1 10.0 0/1 18.1s

Meilleurs modèles par Nombre de Mauvaise réponse

Nombre de Mauvaise réponse vs score moyen

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé