Échecs par catégorie AI BENCHY
Spécifique au domaine : Mise en forme supplémentaire
Spécifique au domaine
Mise en forme supplémentaire
Voyez quels modèles d'IA ont le plus de chances de rencontrer Mise en forme supplémentaire sur Spécifique au domaine, pour repérer plus vite les points faibles.
Raisons d'échec
| Rang | Modèle | Entreprise | Nombre de Mise en forme supplémentaire | Score de catégorie | Tests corrects | Temps de réponse (moy.) |
|---|---|---|---|---|---|---|
| #37 | Claude Opus 4.6 medium | Anthropic | 2 | 3.0 | 0/3 | 83.4s |
| #26 | Claude Sonnet 4.6 medium | Anthropic | 1 | 2.9 | 0/3 | 0ms |
| #35 | MiMo-V2-Omni medium | Xiaomi | 1 | 3.0 | 0/3 | 55.1s |
| #47 | Grok 4.20 medium | X AI | 1 | 5.3 | 1/3 | 27.0s |
| #50 | Hunter Alpha medium | OpenRouter | 1 | 3.0 | 0/3 | 10.5s |
| #56 | Grok 4.20 Multi Agent Beta medium | X AI | 1 | 2.9 | 0/3 | 24.7s |
| #82 | Grok 4.20 none | X AI | 1 | 3.0 | 0/3 | 687ms |