Ranking de Conhecimentos gerais x Erro de API

Veja quais modelos de IA têm mais chance de encontrar Erro de API em Conhecimentos gerais, para identificar pontos fracos mais rápido. Ordenar por: Tempo de resposta (médio) ↑.

Modelos exibidos

Falhas totais

Modelo mais afetado

Gemini 3 PRO Preview 1

Motivos de falha

Resposta incorreta168 Erro de API13 Sem resposta13

Categorias

Programação45 Combinado26 Chamada de ferramentas17 Análise e extração de dados14 Truques anti-IA14 Conhecimentos gerais13 Inteligência geral12 Resolução de quebra-cabeças12 Específico do domínio7 Seguimento de instruções1

13/13

Posição	Modelo	Empresa	Contagem de Erro de API	Pontuação da categoria	Custo total	Testes corretos	Tempo de resposta (médio)
#133	Gemini 3 PRO Preview medium	Google	1	3.0	$0.385	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.385 Tempo de resposta (médio) 0ms
#162	Ling-2.6-1T none	Inclusionai	1	3.0	$0.016	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.016 Tempo de resposta (médio) 0ms
#175	Qwen3.6 Plus Preview medium	Qwen	1	3.0	$0.000	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 0ms
#186	Laguna M.1 medium	Poolside	1	3.0	$0.033	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.033 Tempo de resposta (médio) 0ms
#192	Laguna M.1 none	Poolside	1	3.0	$0.009	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.009 Tempo de resposta (médio) 0ms
#193	Elephant Alpha none	Openrouter	1	3.0	$0.000	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 0ms
#195	Elephant Alpha medium	Openrouter	1	3.0	$0.000	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 0ms
#198	Laguna Xs.2 medium	Poolside	1	3.0	$0.015	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.015 Tempo de resposta (médio) 0ms
#205	Laguna Xs.2 none	Poolside	1	3.0	$0.004	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.004 Tempo de resposta (médio) 0ms
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	3.0	$0.000	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 0ms
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1	3.0	$0.000	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 0ms
#204	Qwen3.5-9B medium	Qwen	1	3.0	$0.036	0/1	177.0s
Total de testes 1 Testes errados 1 Custo total $0.036 Tempo de resposta (médio) 177.0s
#137	North Mini Code medium	Cohere	1	3.0	$0.000	0/1	305.0s
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 305.0s

Filtrar modelos

Melhores modelos por Contagem de Erro de API

Contagem de Erro de API vs Pontuação

Melhores modelos por Tempo de resposta (médio)

Melhores modelos por Custo desperdiçado estimado

Conhecimentos gerais: Erro de API

Filtrar modelos

Melhores modelos por Contagem de Erro de API

Contagem de Erro de API vs Pontuação

Melhores modelos por Tempo de resposta (médio)

Melhores modelos por Custo desperdiçado estimado