Échecs par catégorie AI BENCHY
Spécifique au domaine : Erreur API
Spécifique au domaine
Erreur API
Voyez quels modèles d'IA ont le plus de chances de rencontrer Erreur API sur Spécifique au domaine, pour repérer plus vite les points faibles. Trier par: Temps de réponse (moy.) ↑.
Raisons d'échec
| Rang | Modèle | Entreprise | Nombre de Erreur API | Score de catégorie | Tests corrects | Temps de réponse (moy.) |
|---|---|---|---|---|---|---|
| #160 | LFM2-24B-A2B none | Liquid | 1 | 5.9 | 1/3 | 287ms |
| #133 | DeepSeek V3.2 none | DeepSeek | 1 | 2.9 | 0/3 | 4.17s |
| #132 | Mistral Small 4 medium | Mistral | 1 | 5.3 | 1/3 | 6.11s |
| #156 | Hy3 preview none | Tencent | 1 | 3.6 | 0/3 | 17.6s |
| #93 | Qwen3.6 Plus Preview medium | Qwen | 1 | 3.0 | 0/3 | 22.1s |
| #103 | DeepSeek V4 Pro high | DeepSeek | 1 | 2.9 | 0/3 | 205.7s |