Échecs par catégorie AI BENCHY
Programmation : Mise en forme supplémentaire
Programmation
Mise en forme supplémentaire
Voyez quels modèles d'IA ont le plus de chances de rencontrer Mise en forme supplémentaire sur Programmation, pour repérer plus vite les points faibles. Trier par: Temps de réponse (moy.) ↓.
Raisons d'échec
| Rang | Modèle | Entreprise | Nombre de Mise en forme supplémentaire | Score de catégorie | Tests corrects | Temps de réponse (moy.) |
|---|---|---|---|---|---|---|
| #40 | MiMo-V2.5-Pro medium | Xiaomi | 1 | 7.0 | 1/2 | 81.7s |
| #45 | Grok Build 0.1 medium | X AI | 1 | 5.3 | 0/2 | 67.4s |
| #31 | Grok 4.3 medium | X AI | 1 | 7.4 | 1/2 | 55.3s |
| #106 | Owl Alpha none | Openrouter | 1 | 7.0 | 1/2 | 39.7s |
| #46 | Claude Sonnet 4.6 medium | Anthropic | 1 | 6.9 | 1/2 | 33.9s |
| #69 | Claude Sonnet 4.6 none | Anthropic | 1 | 6.8 | 1/2 | 6.73s |
| #93 | MiMo-V2-Omni none | Xiaomi | 1 | 5.1 | 0/2 | 2.75s |