AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Falhas por categoria AI BENCHY

Específico do domínio: Sem resposta

Específico do domínio
Sem resposta

Veja quais modelos de IA têm mais chance de encontrar Sem resposta em Específico do domínio, para identificar pontos fracos mais rápido. Ordenar por: Tempo de resposta (médio) ↑.

Modelos exibidos

5

Falhas totais

5

Modelo mais afetado

Laguna Xs.2 1
Posição Modelo Empresa Contagem de Sem resposta Pontuação da categoria Testes corretos Tempo de resposta (médio)
#107 Laguna Xs.2 medium Poolside 1 4.1 0/3 11.1s
#80 Mimo V2 Omni medium Xiaomi 1 3.0 0/3 47.9s
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 1 2.9 0/3 56.7s
#71 Step 3.7 Flash high Stepfun 1 4.1 0/3 149.6s
#158 GLM 4.7 Flash medium Z.ai 1 3.5 0/3 174.6s

Melhores modelos por Contagem de Sem resposta

Contagem de Sem resposta vs Pontuação

Melhores modelos por Tempo de resposta (médio)

Melhores modelos por Custo desperdiçado estimado