Échecs AI BENCHY
Échecs Mise en forme supplémentaire
Voyez quels modèles d'IA rencontrent le plus souvent Mise en forme supplémentaire, pour repérer les risques de fiabilité avant de choisir. Trier par: Temps de réponse (moy.) ↓.
| Rang | Modèle | Entreprise | Nombre de Mise en forme supplémentaire | Score | Tests corrects | Temps de réponse (moy.) |
|---|---|---|---|---|---|---|
| #161 | Qwen3.5-9B medium | Qwen | 1 | 4.2 | 3/21 | 82.2s |
| #30 | Qwen3.5-27B medium | Qwen | 1 | 7.8 | 13/21 | 68.4s |
| #67 | MiniMax M3 medium | Minimax | 1 | 7.1 | 11/21 | 68.2s |
| #47 | Grok Build 0.1 medium | X AI | 3 | 7.4 | 13/21 | 49.9s |
| #38 | Grok 4.3 medium | X AI | 1 | 7.6 | 13/21 | 47.5s |
| #80 | Mimo V2 Omni medium | Xiaomi | 1 | 6.7 | 10/21 | 41.2s |
| #55 | GLM 5.1 medium | Z.ai | 1 | 7.3 | 12/21 | 33.7s |
| #65 | Grok 4.20 medium | X AI | 1 | 7.1 | 12/21 | 27.7s |
| #56 | MiMo-V2.5 medium | Xiaomi | 2 | 7.3 | 12/21 | 27.1s |
| #139 | DeepSeek V4 Flash none | DeepSeek | 2 | 5.0 | 5/21 | 26.8s |
| #43 | MiMo-V2.5-Pro medium | Xiaomi | 3 | 7.5 | 12/21 | 26.1s |
| #69 | Claude Opus 4.6 medium | Anthropic | 5 | 7.0 | 12/21 | 25.9s |
| #51 | Mimo V2 PRO medium | Xiaomi | 1 | 7.4 | 12/21 | 22.2s |
| #64 | MiMo-V2-Flash medium | Xiaomi | 1 | 7.2 | 12/21 | 20.1s |
| #52 | Claude Sonnet 4.6 medium | Anthropic | 3 | 7.4 | 13/21 | 17.1s |