AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Échecs AI BENCHY

Échecs Erreur API

Voyez quels modèles d'IA rencontrent le plus souvent Erreur API, pour repérer les risques de fiabilité avant de choisir. Trier par: Temps de réponse (moy.) ↑.

Modèles affichés

3

Échecs totaux

27

Modèle le plus touché

Step 3.5 Flash 1
Rang Modèle Entreprise Nombre de Erreur API Score Tests corrects Temps de réponse (moy.)
#14 Gemma 4 31B medium Google 2 8.3 13/18 24.9s
#43 Qwen3.5-35B-A3B medium Qwen 1 7.4 10/18 44.5s
#32 Qwen3.5-Flash medium Qwen 1 7.8 11/18 66.7s

Meilleurs modèles par Nombre de Erreur API

Nombre de Erreur API vs Score

Meilleurs modèles par Temps de réponse (moy.)