AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Échecs par catégorie AI BENCHY

Programmation : Délai dépassé

Programmation
Délai dépassé

Voyez quels modèles d'IA ont le plus de chances de rencontrer Délai dépassé sur Programmation, pour repérer plus vite les points faibles.

Modèles affichés

12

Échecs totaux

12

Modèle le plus touché

Gemma 4 31B 1
Rang Modèle Entreprise Nombre de Délai dépassé Score de catégorie Tests corrects Temps de réponse (moy.)
#23 Gemma 4 31B medium Google 1 3.8 0/2 110.9s
#38 Qwen3.5-122B-A10B medium Qwen 1 4.1 0/2 119.6s
#47 Gemma 4 26B A4B medium Google 1 2.9 0/2 258.4s
#51 GLM 5.1 medium Z.ai 1 4.7 0/2 145.6s
#56 Qwen3.5-Flash medium Qwen 1 4.1 0/2 54.2s
#67 MiMo-V2-Flash medium Xiaomi 1 4.1 0/2 7.20s
#71 DeepSeek V3.2 medium DeepSeek 1 3.9 0/2 185.0s
#79 Kimi K2.5 medium Moonshot AI 1 4.1 0/2 215.9s
#91 Gemma 4 26B A4B none Google 1 4.1 0/2 3.83s
#119 MiniMax M2.5 medium Minimax 1 3.5 0/2 125.8s
#141 Qwen3 Coder Next medium Qwen 1 4.1 0/2 1.17s
#148 GLM 4.7 Flash medium Z.ai 1 3.4 0/2 55.3s

Meilleurs modèles par Nombre de Délai dépassé

Nombre de Délai dépassé vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé