Falhas por categoria AI BENCHY
Específico do domínio: Erro de API
Específico do domínio
Erro de API
Veja quais modelos de IA têm mais chance de encontrar Erro de API em Específico do domínio, para identificar pontos fracos mais rápido.
Motivos de falha
| Posição | Modelo | Empresa | Contagem de Erro de API | Pontuação da categoria | Testes corretos | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|
| #93 | Qwen3.6 Plus Preview medium | Qwen | 1 | 3.0 | 0/3 | 22.1s |
| #103 | DeepSeek V4 Pro high | DeepSeek | 1 | 2.9 | 0/3 | 205.7s |
| #132 | Mistral Small 4 medium | Mistral | 1 | 5.3 | 1/3 | 6.11s |
| #133 | DeepSeek V3.2 none | DeepSeek | 1 | 2.9 | 0/3 | 4.17s |
| #156 | Hy3 preview none | Tencent | 1 | 3.6 | 0/3 | 17.6s |
| #160 | LFM2-24B-A2B none | Liquid | 1 | 5.9 | 1/3 | 287ms |