AI BENCHY
Your ad here

Échecs par catégorie AI BENCHY

Intelligence générale : Mauvaise réponse

Intelligence générale
Mauvaise réponse

Voyez quels modèles d'IA ont le plus de chances de rencontrer Mauvaise réponse sur Intelligence générale, pour repérer plus vite les points faibles. Trier par: Temps de réponse (moy.) ↓.

Modèles affichés

10

Échecs totaux

10

Modèle le plus touché

GLM 4.7 Flash 1
Rang Modèle Entreprise Nombre de Mauvaise réponse Score de catégorie Tests corrects Temps de réponse (moy.)
#93 GLM 4.7 Flash medium Z.ai 1 3.6 0/1 18.1s
#18 GLM 5 Turbo medium Z.ai 1 6.1 0/1 10.1s
#49 Qwen3.5 Plus 2026-02-15 none Qwen 1 4.4 0/1 2.26s
#66 GPT-5.4 none OpenAI 1 4.4 0/1 1.78s
#74 GLM 4.7 Flash none Z.ai 1 4.0 0/1 1.59s
#89 GPT-4o-mini none OpenAI 1 4.0 0/1 909ms
#75 GLM 5.1 none Z.ai 1 5.0 0/1 790ms
#83 Mistral Small 4 none Mistral 1 4.0 0/1 729ms
#82 Grok 4.20 none X AI 1 4.8 0/1 659ms
#62 Gemini 2.5 Flash none Google 1 5.0 0/1 615ms

Meilleurs modèles par Nombre de Mauvaise réponse

Nombre de Mauvaise réponse vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé