AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Échecs par catégorie AI BENCHY

Spécifique au domaine : Erreur API

Spécifique au domaine
Erreur API

Voyez quels modèles d'IA ont le plus de chances de rencontrer Erreur API sur Spécifique au domaine, pour repérer plus vite les points faibles. Trier par: Temps de réponse (moy.) ↓.

Modèles affichés

6

Échecs totaux

6

Modèle le plus touché

DeepSeek V4 Pro 1
Rang Modèle Entreprise Nombre de Erreur API Score de catégorie Tests corrects Temps de réponse (moy.)
#103 DeepSeek V4 Pro high DeepSeek 1 2.9 0/3 205.7s
#93 Qwen3.6 Plus Preview medium Qwen 1 3.0 0/3 22.1s
#156 Hy3 preview none Tencent 1 3.6 0/3 17.6s
#132 Mistral Small 4 medium Mistral 1 5.3 1/3 6.11s
#133 DeepSeek V3.2 none DeepSeek 1 2.9 0/3 4.17s
#160 LFM2-24B-A2B none Liquid 1 5.9 1/3 287ms

Meilleurs modèles par Nombre de Erreur API

Nombre de Erreur API vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé