AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Échecs AI BENCHY

Échecs Délai dépassé

Voyez quels modèles d'IA rencontrent le plus souvent Délai dépassé, pour repérer les risques de fiabilité avant de choisir. Trier par: Nombre d'échecs ↑.

Modèles affichés

4

Échecs totaux

73

Modèle le plus touché

Claude Opus 4.7 1
Rang Modèle Entreprise Nombre de Délai dépassé Score Tests corrects Temps de réponse (moy.)
#129 MiniMax M2.5 medium Minimax 4 5.3 5/21 65.4s
#66 Qwen3.5-35B-A3B medium Qwen 5 7.1 11/21 72.6s
#73 Seed-2.0-Mini medium Bytedance Seed 5 6.9 11/21 80.2s
#161 Qwen3.5-9B medium Qwen 11 4.2 3/21 82.2s

Meilleurs modèles par Nombre de Délai dépassé

Nombre de Délai dépassé vs Score

Meilleurs modèles par Temps de réponse (moy.)