AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Échecs par catégorie AI BENCHY

Culture générale : Erreur API

Culture générale
Erreur API

Voyez quels modèles d'IA ont le plus de chances de rencontrer Erreur API sur Culture générale, pour repérer plus vite les points faibles. Trier par: Tests corrects ↓.

Modèles affichés

12

Échecs totaux

12

Modèle le plus touché

Gemini 3 PRO Preview 1
Rang Modèle Entreprise Nombre de Erreur API Score de catégorie Tests corrects Temps de réponse (moy.)
#35 Gemini 3 PRO Preview medium Google 1 3.0 0/1 0ms
#92 Laguna M.1 medium Poolside 1 3.0 0/1 0ms
#93 Qwen3.6 Plus Preview medium Qwen 1 3.0 0/1 0ms
#107 Laguna Xs.2 medium Poolside 1 3.0 0/1 0ms
#136 Elephant Alpha medium Openrouter 1 3.0 0/1 0ms
#137 Elephant Alpha none Openrouter 1 3.0 0/1 0ms
#145 Laguna M.1 none Poolside 1 3.0 0/1 0ms
#146 Laguna Xs.2 none Poolside 1 3.0 0/1 0ms
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 1 3.0 0/1 0ms
#159 Ling-2.6-1T none Inclusionai 1 3.0 0/1 0ms
#161 Qwen3.5-9B medium Qwen 1 3.0 0/1 177.0s
#162 Nemotron 3 Nano Omni 30b A3b Reasoning none NVIDIA 1 3.0 0/1 0ms

Meilleurs modèles par Nombre de Erreur API

Nombre de Erreur API vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé