AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Échecs par catégorie AI BENCHY

Spécifique au domaine : Erreur API

Spécifique au domaine
Erreur API

Voyez quels modèles d'IA ont le plus de chances de rencontrer Erreur API sur Spécifique au domaine, pour repérer plus vite les points faibles. Trier par: Tests corrects ↓.

Modèles affichés

6

Échecs totaux

6

Modèle le plus touché

Mistral Small 4 1
Rang Modèle Entreprise Nombre de Erreur API Score de catégorie Tests corrects Temps de réponse (moy.)
#132 Mistral Small 4 medium Mistral 1 5.3 1/3 6.11s
#160 LFM2-24B-A2B none Liquid 1 5.9 1/3 287ms
#93 Qwen3.6 Plus Preview medium Qwen 1 3.0 0/3 22.1s
#103 DeepSeek V4 Pro high DeepSeek 1 2.9 0/3 205.7s
#133 DeepSeek V3.2 none DeepSeek 1 2.9 0/3 4.17s
#156 Hy3 preview none Tencent 1 3.6 0/3 17.6s

Meilleurs modèles par Nombre de Erreur API

Nombre de Erreur API vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé