AI BENCHY
Your ad here

Échecs AI BENCHY

Échecs Délai dépassé

Voyez quels modèles d'IA rencontrent le plus souvent Délai dépassé, pour repérer les risques de fiabilité avant de choisir. Trier par: Nombre d'échecs ↑.

Modèles affichés

15

Échecs totaux

61

Modèle le plus touché

Claude Opus 4.7 1
Rang Modèle Entreprise Nombre de Délai dépassé Score Tests corrects Temps de réponse (moy.)
#93 GLM 4.7 Flash medium Z.ai 1 4.6 4/18 32.3s
#8 Qwen3.5 Plus 2026-02-15 medium Qwen 2 8.5 14/18 46.6s
#19 Qwen3.5-122B-A10B medium Qwen 2 8.1 13/18 31.4s
#24 Gemma 4 26B A4B medium Google 2 8.0 13/18 25.0s
#27 DeepSeek V3.2 medium DeepSeek 2 8.0 12/18 46.4s
#33 GLM 5.1 medium Z.ai 2 7.8 12/18 24.1s
#34 Kimi K2.6 medium Moonshot AI 2 7.7 11/18 45.2s
#46 Kimi K2.5 medium Moonshot AI 2 7.0 9/18 72.4s
#50 Hunter Alpha medium OpenRouter 2 6.7 8/18 10.3s
#80 MiniMax M2.7 medium Minimax 2 5.3 4/18 31.1s
#32 Qwen3.5-Flash medium Qwen 4 7.8 11/18 66.7s
#39 Seed-2.0-Mini medium Bytedance Seed 4 7.5 11/18 69.7s
#43 Qwen3.5-35B-A3B medium Qwen 4 7.4 10/18 44.5s
#71 MiniMax M2.5 medium Minimax 4 5.7 5/18 39.6s
#97 Qwen3.5-9B medium Qwen 11 4.4 3/18 73.6s

Meilleurs modèles par Nombre de Délai dépassé

Nombre de Délai dépassé vs Score

Meilleurs modèles par Temps de réponse (moy.)