Échecs par catégorie AI BENCHY
Programmation : Mise en forme supplémentaire
Programmation
Mise en forme supplémentaire
Voyez quels modèles d'IA ont le plus de chances de rencontrer Mise en forme supplémentaire sur Programmation, pour repérer plus vite les points faibles. Trier par: Temps de réponse (moy.) ↑.
Raisons d'échec
| Rang | Modèle | Entreprise | Nombre de Mise en forme supplémentaire | Score de catégorie | Tests corrects | Temps de réponse (moy.) |
|---|---|---|---|---|---|---|
| #93 | MiMo-V2-Omni none | Xiaomi | 1 | 5.1 | 0/2 | 2.75s |
| #69 | Claude Sonnet 4.6 none | Anthropic | 1 | 6.8 | 1/2 | 6.73s |
| #46 | Claude Sonnet 4.6 medium | Anthropic | 1 | 6.9 | 1/2 | 33.9s |
| #106 | Owl Alpha none | Openrouter | 1 | 7.0 | 1/2 | 39.7s |
| #31 | Grok 4.3 medium | X AI | 1 | 7.4 | 1/2 | 55.3s |
| #45 | Grok Build 0.1 medium | X AI | 1 | 5.3 | 0/2 | 67.4s |
| #40 | MiMo-V2.5-Pro medium | Xiaomi | 1 | 7.0 | 1/2 | 81.7s |