Échecs par catégorie AI BENCHY
Spécifique au domaine : Erreur API
Spécifique au domaine
Erreur API
Voyez quels modèles d'IA ont le plus de chances de rencontrer Erreur API sur Spécifique au domaine, pour repérer plus vite les points faibles.
Raisons d'échec
| Rang | Modèle | Entreprise | Nombre de Erreur API | Score de catégorie | Tests corrects | Temps de réponse (moy.) |
|---|---|---|---|---|---|---|
| #93 | Qwen3.6 Plus Preview medium | Qwen | 1 | 3.0 | 0/3 | 22.1s |
| #103 | DeepSeek V4 Pro high | DeepSeek | 1 | 2.9 | 0/3 | 205.7s |
| #132 | Mistral Small 4 medium | Mistral | 1 | 5.3 | 1/3 | 6.11s |
| #133 | DeepSeek V3.2 none | DeepSeek | 1 | 2.9 | 0/3 | 4.17s |
| #156 | Hy3 preview none | Tencent | 1 | 3.6 | 0/3 | 17.6s |
| #160 | LFM2-24B-A2B none | Liquid | 1 | 5.9 | 1/3 | 287ms |