Échecs par catégorie AI BENCHY
Intelligence générale : Erreur API
Intelligence générale
Erreur API
Voyez quels modèles d'IA ont le plus de chances de rencontrer Erreur API sur Intelligence générale, pour repérer plus vite les points faibles. Trier par: Temps de réponse (moy.) ↑.
Raisons d'échec
| Rang | Modèle | Entreprise | Nombre de Erreur API | Score de catégorie | Tests corrects | Temps de réponse (moy.) |
|---|---|---|---|---|---|---|
| #82 | Hy3 preview high | Tencent | 1 | 3.0 | 0/1 | 0ms |
| #89 | Hy3 preview low | Tencent | 1 | 3.0 | 0/1 | 0ms |
| #92 | Laguna M.1 medium | Poolside | 1 | 3.0 | 0/1 | 0ms |
| #93 | Qwen3.6 Plus Preview medium | Qwen | 1 | 3.0 | 0/1 | 0ms |
| #107 | Laguna Xs.2 medium | Poolside | 1 | 3.0 | 0/1 | 0ms |
| #145 | Laguna M.1 none | Poolside | 1 | 3.0 | 0/1 | 0ms |
| #146 | Laguna Xs.2 none | Poolside | 1 | 3.0 | 0/1 | 0ms |
| #149 | Nemotron 3 Nano Omni 30b A3b Reasoning medium | NVIDIA | 1 | 3.0 | 0/1 | 0ms |
| #162 | Nemotron 3 Nano Omni 30b A3b Reasoning none | NVIDIA | 1 | 3.0 | 0/1 | 0ms |
| #41 | Nemotron 3 Ultra 550b A55b medium | NVIDIA | 1 | 3.7 | 0/1 | 2.52s |
| #133 | DeepSeek V3.2 none | DeepSeek | 1 | 4.7 | 0/1 | 9.32s |
| #72 | DeepSeek V3.2 medium | DeepSeek | 1 | 3.4 | 0/1 | 58.3s |