AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Falhas por categoria AI BENCHY

Programação: Erro de API

Programação
Erro de API

Veja quais modelos de IA têm mais chance de encontrar Erro de API em Programação, para identificar pontos fracos mais rápido. Ordenar por: Testes corretos ↑.

Modelos exibidos

6

Falhas totais

6

Modelo mais afetado

Gemini 3 PRO Preview 1
Posição Modelo Empresa Contagem de Erro de API Pontuação da categoria Testes corretos Tempo de resposta (médio)
#19 Gemini 3 PRO Preview medium Google 1 3.0 0/2 0ms
#32 Step 3.5 Flash none Stepfun 1 3.0 0/1 0ms
#33 Qwen3.6 Plus medium Qwen 1 4.1 0/2 201.7s
#75 Hunter Alpha medium OpenRouter 1 3.0 0/1 0ms
#96 Nemotron 3 Super medium NVIDIA 1 3.1 0/2 62.4s
#108 Hunter Alpha none OpenRouter 1 3.0 0/1 0ms

Melhores modelos por Contagem de Erro de API

Contagem de Erro de API vs Pontuação

Melhores modelos por Tempo de resposta (médio)

Melhores modelos por Custo desperdiçado estimado