AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Échecs par catégorie AI BENCHY

Spécifique au domaine : Mise en forme supplémentaire

Spécifique au domaine
Mise en forme supplémentaire

Voyez quels modèles d'IA ont le plus de chances de rencontrer Mise en forme supplémentaire sur Spécifique au domaine, pour repérer plus vite les points faibles. Trier par: Temps de réponse (moy.) ↑.

Modèles affichés

10

Échecs totaux

12

Modèle le plus touché

Claude Sonnet 4.6 1
Rang Modèle Entreprise Nombre de Mise en forme supplémentaire Score de catégorie Tests corrects Temps de réponse (moy.)
#52 Claude Sonnet 4.6 medium Anthropic 1 2.9 0/3 0ms
#127 Grok 4.20 none X AI 1 3.0 0/3 687ms
#79 Hunter Alpha medium OpenRouter 1 3.0 0/3 10.5s
#84 Grok 4.20 Multi Agent Beta medium X AI 1 2.9 0/3 24.7s
#65 Grok 4.20 medium X AI 1 5.3 1/3 27.0s
#56 MiMo-V2.5 medium Xiaomi 1 5.3 1/3 34.5s
#43 MiMo-V2.5-Pro medium Xiaomi 2 5.3 1/3 37.9s
#80 Mimo V2 Omni medium Xiaomi 1 3.0 0/3 47.9s
#69 Claude Opus 4.6 medium Anthropic 2 3.0 0/3 83.4s
#47 Grok Build 0.1 medium X AI 1 5.3 1/3 158.0s

Meilleurs modèles par Nombre de Mise en forme supplémentaire

Nombre de Mise en forme supplémentaire vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé