AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Échecs par catégorie AI BENCHY

Programmation : Mise en forme supplémentaire

Programmation
Mise en forme supplémentaire

Voyez quels modèles d'IA ont le plus de chances de rencontrer Mise en forme supplémentaire sur Programmation, pour repérer plus vite les points faibles. Trier par: Tests corrects ↓.

Modèles affichés

7

Échecs totaux

7

Modèle le plus touché

Grok 4.3 1
Rang Modèle Entreprise Nombre de Mise en forme supplémentaire Score de catégorie Tests corrects Temps de réponse (moy.)
#31 Grok 4.3 medium X AI 1 7.4 1/2 55.3s
#40 MiMo-V2.5-Pro medium Xiaomi 1 7.0 1/2 81.7s
#46 Claude Sonnet 4.6 medium Anthropic 1 6.9 1/2 33.9s
#69 Claude Sonnet 4.6 none Anthropic 1 6.8 1/2 6.73s
#106 Owl Alpha none Openrouter 1 7.0 1/2 39.7s
#45 Grok Build 0.1 medium X AI 1 5.3 0/2 67.4s
#93 MiMo-V2-Omni none Xiaomi 1 5.1 0/2 2.75s

Meilleurs modèles par Nombre de Mise en forme supplémentaire

Nombre de Mise en forme supplémentaire vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé