Échecs par catégorie AI BENCHY
Spécifique au domaine : Erreur API
Spécifique au domaine
Erreur API
Voyez quels modèles d'IA ont le plus de chances de rencontrer Erreur API sur Spécifique au domaine, pour repérer plus vite les points faibles. Trier par: Temps de réponse (moy.) ↓.
Raisons d'échec
| Rang | Modèle | Entreprise | Nombre de Erreur API | Score de catégorie | Tests corrects | Temps de réponse (moy.) |
|---|---|---|---|---|---|---|
| #103 | DeepSeek V4 Pro high | DeepSeek | 1 | 2.9 | 0/3 | 205.7s |
| #93 | Qwen3.6 Plus Preview medium | Qwen | 1 | 3.0 | 0/3 | 22.1s |
| #156 | Hy3 preview none | Tencent | 1 | 3.6 | 0/3 | 17.6s |
| #132 | Mistral Small 4 medium | Mistral | 1 | 5.3 | 1/3 | 6.11s |
| #133 | DeepSeek V3.2 none | DeepSeek | 1 | 2.9 | 0/3 | 4.17s |
| #160 | LFM2-24B-A2B none | Liquid | 1 | 5.9 | 1/3 | 287ms |