Ranking de falhas por Erro de API

Veja quais modelos de IA encontram Erro de API com mais frequência para identificar riscos de confiabilidade antes de escolher.

Modelos exibidos

Falhas totais

159

Modelo mais afetado

Qwen3.6 Plus Preview 8

Categorias

Na categoria Programação44 Na categoria Combinado25 Na categoria Chamada de ferramentas17 Na categoria Análise e extração de dados14 Na categoria Truques anti-IA14 Na categoria Conhecimentos gerais13 Na categoria Inteligência geral12 Na categoria Resolução de quebra-cabeças12 Na categoria Específico do domínio7 Na categoria Seguimento de instruções1

66/66

Posição	Modelo	Empresa	Contagem de Erro de API	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#171	Qwen3.6 Plus Preview medium	Qwen	8	4.9	$0.000	9/19	15.2s
Total de testes 19 Testes errados 10 Custo total $0.000 Tempo de resposta (médio) 15.2s
#131	Hy3 preview high	Tencent	7	5.9	$0.048	11/21	56.6s
Total de testes 21 Testes errados 10 Custo total $0.048 Tempo de resposta (médio) 56.6s
#149	Hy3 preview low	Tencent	7	5.5	$0.015	10/21	24.6s
Total de testes 21 Testes errados 11 Custo total $0.015 Tempo de resposta (médio) 24.6s
#175	Ring-2.6-1T none	Inclusionai	6	4.8	$0.026	9/22	55.1s
Total de testes 22 Testes errados 13 Custo total $0.026 Tempo de resposta (médio) 55.1s
#203	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	6	3.4	$0.000	4/19	17.1s
Total de testes 19 Testes errados 15 Custo total $0.000 Tempo de resposta (médio) 17.1s
#204	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	6	3.2	$0.000	2/19	728ms
Total de testes 19 Testes errados 17 Custo total $0.000 Tempo de resposta (médio) 728ms
#78	Gemini 3.5 Flash none	Google	4	7.0	$1.079	15/22	9.93s
Total de testes 22 Testes errados 7 Custo total $1.079 Tempo de resposta (médio) 9.93s
#129	Gemini 3 PRO Preview medium	Google	4	6.0	$0.385	14/21	9.05s
Total de testes 21 Testes errados 7 Custo total $0.385 Tempo de resposta (médio) 9.05s
#136	Nemotron 3 Super medium	NVIDIA	4	5.7	$0.066	8/22	52.0s
Total de testes 22 Testes errados 14 Custo total $0.066 Tempo de resposta (médio) 52.0s
#169	DeepSeek V3.2 none	DeepSeek	4	5.0	$0.054	6/22	18.3s
Total de testes 22 Testes errados 16 Custo total $0.054 Tempo de resposta (médio) 18.3s
#182	Laguna M.1 medium	Poolside	4	4.7	$0.033	9/19	14.7s
Total de testes 19 Testes errados 10 Custo total $0.033 Tempo de resposta (médio) 14.7s
#188	Laguna M.1 none	Poolside	4	4.4	$0.009	4/19	2.89s
Total de testes 19 Testes errados 15 Custo total $0.009 Tempo de resposta (médio) 2.89s
#194	Laguna Xs.2 medium	Poolside	4	4.1	$0.015	6/19	6.73s
Total de testes 19 Testes errados 13 Custo total $0.015 Tempo de resposta (médio) 6.73s
#195	Hy3 preview none	Tencent	4	4.0	$0.003	4/21	12.9s
Total de testes 21 Testes errados 17 Custo total $0.003 Tempo de resposta (médio) 12.9s
#201	Laguna Xs.2 none	Poolside	4	3.8	$0.004	5/19	806ms
Total de testes 19 Testes errados 14 Custo total $0.004 Tempo de resposta (médio) 806ms

1 2 3 4 5

→

Falhas por Erro de API

Filtrar modelos

Melhores modelos por Contagem de Erro de API

Contagem de Erro de API vs Pontuação

Melhores modelos por Tempo de resposta (médio)