AI BENCHY
Advertise here

Échecs par catégorie AI BENCHY

Culture générale : Erreur API

Culture générale
Erreur API

Voyez quels modèles d'IA ont le plus de chances de rencontrer Erreur API sur Culture générale, pour repérer plus vite les points faibles. Trier par: Temps de réponse (moy.) ↑.

Modèles affichés

12

Échecs totaux

12

Modèle le plus touché

Gemini 3 PRO Preview 1
Rang Modèle Entreprise Nombre de Erreur API Score de catégorie Tests corrects Temps de réponse (moy.)
#35 Gemini 3 PRO Preview medium Google 1 3.0 0/1 0ms
#92 Laguna M.1 medium Poolside 1 3.0 0/1 0ms
#93 Qwen3.6 Plus Preview medium Qwen 1 3.0 0/1 0ms
#107 Laguna Xs.2 medium Poolside 1 3.0 0/1 0ms
#136 Elephant Alpha medium Openrouter 1 3.0 0/1 0ms
#137 Elephant Alpha none Openrouter 1 3.0 0/1 0ms
#145 Laguna M.1 none Poolside 1 3.0 0/1 0ms
#146 Laguna Xs.2 none Poolside 1 3.0 0/1 0ms
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 1 3.0 0/1 0ms
#159 Ling-2.6-1T none Inclusionai 1 3.0 0/1 0ms
#162 Nemotron 3 Nano Omni 30b A3b Reasoning none NVIDIA 1 3.0 0/1 0ms
#161 Qwen3.5-9B medium Qwen 1 3.0 0/1 177.0s

Meilleurs modèles par Nombre de Erreur API

Nombre de Erreur API vs Score

Meilleurs modèles par Temps de réponse (moy.)

Meilleurs modèles par Coût gaspillé estimé