AI BENCHY
Your ad here

Échecs par catégorie AI BENCHY

Spécifique au domaine : Mise en forme supplémentaire

Spécifique au domaine
Mise en forme supplémentaire

Voyez quels modèles d'IA ont le plus de chances de rencontrer Mise en forme supplémentaire sur Spécifique au domaine, pour repérer plus vite les points faibles. Trier par: Tests corrects ↑.

Modèles affichés

7

Échecs totaux

8

Modèle le plus touché

Claude Sonnet 4.6 1
Rang Modèle Entreprise Nombre de Mise en forme supplémentaire Score de catégorie Tests corrects Temps de réponse (moy.)
#26 Claude Sonnet 4.6 medium Anthropic 1 2.9 0/3 0ms
#35 MiMo-V2-Omni medium Xiaomi 1 3.0 0/3 55.1s
#37 Claude Opus 4.6 medium Anthropic 2 3.0 0/3 83.4s
#50 Hunter Alpha medium OpenRouter 1 3.0 0/3 10.5s
#56 Grok 4.20 Multi Agent Beta medium X AI 1 2.9 0/3 24.7s
#82 Grok 4.20 none X AI 1 3.0 0/3 687ms
#47 Grok 4.20 medium X AI 1 5.3 1/3 27.0s

Meilleurs modèles par Nombre de Mise en forme supplémentaire

Nombre de Mise en forme supplémentaire vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé