AI BENCHY
Advertise here

Falhas por categoria AI BENCHY

Específico do domínio: Sem resposta

Específico do domínio
Sem resposta

Veja quais modelos de IA têm mais chance de encontrar Sem resposta em Específico do domínio, para identificar pontos fracos mais rápido. Ordenar por: Contagem de falhas ↑.

Modelos exibidos

5

Falhas totais

5

Modelo mais afetado

Step 3.7 Flash 1
Posição Modelo Empresa Contagem de Sem resposta Pontuação da categoria Testes corretos Tempo de resposta (médio)
#71 Step 3.7 Flash high Stepfun 1 4.1 0/3 149.6s
#80 Mimo V2 Omni medium Xiaomi 1 3.0 0/3 47.9s
#107 Laguna Xs.2 medium Poolside 1 4.1 0/3 11.1s
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 1 2.9 0/3 56.7s
#158 GLM 4.7 Flash medium Z.ai 1 3.5 0/3 174.6s

Melhores modelos por Contagem de Sem resposta

Contagem de Sem resposta vs Pontuação

Melhores modelos por Tempo de resposta (médio)

Melhores modelos por Custo desperdiçado estimado