Échecs par catégorie AI BENCHY
Résolution d'énigmes : Mise en forme supplémentaire
Résolution d'énigmes
Mise en forme supplémentaire
Voyez quels modèles d'IA ont le plus de chances de rencontrer Mise en forme supplémentaire sur Résolution d'énigmes, pour repérer plus vite les points faibles.
Raisons d'échec
| Rang | Modèle | Entreprise | Nombre de Mise en forme supplémentaire | Score de catégorie | Tests corrects | Temps de réponse (moy.) |
|---|---|---|---|---|---|---|
| #51 | Mimo V2 PRO medium | Xiaomi | 1 | 6.4 | 1/3 | 5.08s |
| #68 | Claude Opus 4.8 none | Anthropic | 1 | 7.7 | 2/3 | 2.74s |
| #77 | Claude Sonnet 4.6 none | Anthropic | 1 | 7.7 | 2/3 | 2.53s |
| #113 | DeepSeek V4 Pro none | DeepSeek | 1 | 7.6 | 2/3 | 16.0s |
| #139 | DeepSeek V4 Flash none | DeepSeek | 1 | 3.1 | 0/3 | 23.7s |