AI BENCHY
Comparer Graphiques Méthodologie
❤️ Made by XCS
Your ad here

Échecs par catégorie AI BENCHY

Analyse et extraction des données
Mauvaise réponse

Voyez quels modèles d'IA ont le plus de chances de rencontrer Mauvaise réponse sur Analyse et extraction des données, pour repérer plus vite les points faibles.

Modèles affichés

11

Échecs totaux

14

Modèle le plus touché

GPT-5 Nano 2
Rang Modèle Entreprise Nombre de Mauvaise réponse Score de catégorie Tests corrects Temps de réponse (moy.)
#34 GPT-5 Nano medium OpenAI 2 10.0 0/2 21.4s
#43 MiniMax M2.5 medium Minimax 2 10.0 0/2 7.48s
#55 LFM2-24B-A2B none Liquid 2 10.0 0/2 714ms
#33 DeepSeek V3.2 none DeepSeek 1 5.4 1/2 9.42s
#36 Mercury 2 medium Inception 1 5.5 1/2 1.11s
#39 gpt-oss-120b medium OpenAI 1 5.5 1/2 1.98s
#46 Kimi K2.5 none Moonshot AI 1 5.4 1/2 42.1s
#48 Qwen3 Coder Next none Qwen 1 5.4 1/2 1.32s
#49 GLM 4.7 Flash none Z.ai 1 5.4 1/2 4.82s
#50 Qwen3 Coder Next medium Qwen 1 5.4 1/2 81.8s
#51 Mercury 2 none Inception 1 5.5 1/2 667ms

Meilleurs modèles par Nombre de Mauvaise réponse

Nombre de Mauvaise réponse vs score moyen

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé