Échecs par catégorie AI BENCHY
Spécifique au domaine : Délai dépassé
Spécifique au domaine
Délai dépassé
Voyez quels modèles d'IA ont le plus de chances de rencontrer Délai dépassé sur Spécifique au domaine, pour repérer plus vite les points faibles. Trier par: Tests corrects ↓.
Raisons d'échec
| Rang | Modèle | Entreprise | Nombre de Délai dépassé | Score de catégorie | Tests corrects | Temps de réponse (moy.) |
|---|---|---|---|---|---|---|
| #11 | Claude Opus 4.7 medium | Anthropic | 1 | 7.7 | 2/3 | 1.17s |
| #25 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 1 | 5.3 | 1/3 | 17.5s |
| #30 | Qwen3.5-27B medium | Qwen | 1 | 5.3 | 1/3 | 79.5s |
| #42 | GPT-5.2 medium | OpenAI | 1 | 5.9 | 1/3 | 77.8s |
| #49 | Qwen3.5-Flash medium | Qwen | 1 | 5.3 | 1/3 | 146.5s |
| #51 | Mimo V2 PRO medium | Xiaomi | 1 | 5.3 | 1/3 | 8.82s |
| #55 | GLM 5.1 medium | Z.ai | 1 | 5.3 | 1/3 | 29.8s |
| #60 | Kimi K2.6 medium | Moonshot AI | 2 | 5.3 | 1/3 | 202.4s |
| #67 | MiniMax M3 medium | Minimax | 2 | 5.5 | 1/3 | 233.1s |
| #86 | Grok 4.1 Fast medium | X AI | 1 | 5.8 | 1/3 | 121.8s |
| #94 | GPT-5 Nano medium | OpenAI | 1 | 5.2 | 1/3 | 204.0s |
| #17 | GLM 5 medium | Z.ai | 1 | 3.5 | 0/3 | 0ms |
| #23 | GLM 5 Turbo medium | Z.ai | 1 | 2.9 | 0/3 | 71.1s |
| #37 | Gemma 4 26B A4B medium | 1 | 2.9 | 0/3 | 23.6s | |
| #52 | Claude Sonnet 4.6 medium | Anthropic | 1 | 2.9 | 0/3 | 0ms |