AI BENCHY
Your ad here

Échecs par catégorie AI BENCHY

Spécifique au domaine : Délai dépassé

Spécifique au domaine
Délai dépassé

Voyez quels modèles d'IA ont le plus de chances de rencontrer Délai dépassé sur Spécifique au domaine, pour repérer plus vite les points faibles. Trier par: Nombre d'échecs ↑.

Modèles affichés

15

Échecs totaux

31

Modèle le plus touché

Claude Opus 4.7 1
Rang Modèle Entreprise Nombre de Délai dépassé Score de catégorie Tests corrects Temps de réponse (moy.)
#3 Claude Opus 4.7 medium Anthropic 1 7.7 2/3 1.17s
#8 Qwen3.5 Plus 2026-02-15 medium Qwen 1 5.3 1/3 17.5s
#10 Qwen3.5-27B medium Qwen 1 5.3 1/3 79.5s
#13 GLM 5 medium Z.ai 1 3.5 0/3 0ms
#18 GLM 5 Turbo medium Z.ai 1 2.9 0/3 71.1s
#23 MiMo-V2-Pro medium Xiaomi 1 5.3 1/3 6.00s
#24 Gemma 4 26B A4B medium Google 1 2.9 0/3 23.6s
#26 Claude Sonnet 4.6 medium Anthropic 1 2.9 0/3 0ms
#27 DeepSeek V3.2 medium DeepSeek 1 5.3 1/3 39.3s
#32 Qwen3.5-Flash medium Qwen 1 5.3 1/3 146.5s
#33 GLM 5.1 medium Z.ai 1 5.3 1/3 29.8s
#40 GPT-5.2 medium OpenAI 1 5.9 1/3 77.8s
#45 GPT-5 Mini medium OpenAI 1 3.6 0/3 44.6s
#46 Kimi K2.5 medium Moonshot AI 1 3.5 0/3 137.3s
#50 Hunter Alpha medium OpenRouter 1 3.0 0/3 10.5s

Meilleurs modèles par Nombre de Délai dépassé

Nombre de Délai dépassé vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé