AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Échecs par catégorie AI BENCHY

Intelligence générale : Erreur API

Intelligence générale
Erreur API

Voyez quels modèles d'IA ont le plus de chances de rencontrer Erreur API sur Intelligence générale, pour repérer plus vite les points faibles. Trier par: Temps de réponse (moy.) ↑.

Modèles affichés

12

Échecs totaux

12

Modèle le plus touché

Hy3 preview 1
Rang Modèle Entreprise Nombre de Erreur API Score de catégorie Tests corrects Temps de réponse (moy.)
#82 Hy3 preview high Tencent 1 3.0 0/1 0ms
#89 Hy3 preview low Tencent 1 3.0 0/1 0ms
#92 Laguna M.1 medium Poolside 1 3.0 0/1 0ms
#93 Qwen3.6 Plus Preview medium Qwen 1 3.0 0/1 0ms
#107 Laguna Xs.2 medium Poolside 1 3.0 0/1 0ms
#145 Laguna M.1 none Poolside 1 3.0 0/1 0ms
#146 Laguna Xs.2 none Poolside 1 3.0 0/1 0ms
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 1 3.0 0/1 0ms
#162 Nemotron 3 Nano Omni 30b A3b Reasoning none NVIDIA 1 3.0 0/1 0ms
#41 Nemotron 3 Ultra 550b A55b medium NVIDIA 1 3.7 0/1 2.52s
#133 DeepSeek V3.2 none DeepSeek 1 4.7 0/1 9.32s
#72 DeepSeek V3.2 medium DeepSeek 1 3.4 0/1 58.3s

Meilleurs modèles par Nombre de Erreur API

Nombre de Erreur API vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé