Ranking de falhas por Sem resposta

Veja quais modelos de IA encontram Sem resposta com mais frequência para identificar riscos de confiabilidade antes de escolher. Ordenar por: Tempo de resposta (médio) ↓.

Modelos exibidos

Falhas totais

Modelo mais afetado

Step 3.5 Flash 1

Categorias

Na categoria Combinado29 Na categoria Programação18 Na categoria Conhecimentos gerais13 Na categoria Análise e extração de dados8 Na categoria Específico do domínio8 Na categoria Truques anti-IA4 Na categoria Resolução de quebra-cabeças3 Na categoria Chamada de ferramentas2 Na categoria Seguimento de instruções2

67/67

Posição	Modelo	Empresa	Contagem de Sem resposta	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#110	Gemma 4 31B medium	Google	1	6.3	$0.163	14/22	75.4s
Total de testes 22 Testes errados 8 Custo total $0.163 Tempo de resposta (médio) 75.4s
#47	MiniMax M3 medium	Minimax	1	7.6	$0.286	12/22	75.0s
Total de testes 22 Testes errados 10 Custo total $0.286 Tempo de resposta (médio) 75.0s
#190	MiniMax M2.5 medium	Minimax	2	4.6	$0.340	5/22	68.3s
Total de testes 22 Testes errados 17 Custo total $0.340 Tempo de resposta (médio) 68.3s
#86	Step 3.7 Flash high	Stepfun	4	6.9	$1.207	11/22	64.7s
Total de testes 22 Testes errados 11 Custo total $1.207 Tempo de resposta (médio) 64.7s
#31	GLM 5.2 high	Z.ai	1	8.0	$0.970	14/22	62.7s
Total de testes 22 Testes errados 8 Custo total $0.970 Tempo de resposta (médio) 62.7s
#143	Gemini 3.1 Flash Lite high	Google	1	5.6	$2.044	10/18	62.0s
Total de testes 18 Testes errados 8 Custo total $2.044 Tempo de resposta (médio) 62.0s
#90	Qwen3.6 35B A3B medium	Qwen	1	6.7	$0.746	13/22	58.1s
Total de testes 22 Testes errados 9 Custo total $0.746 Tempo de resposta (médio) 58.1s
#128	GPT-5 Nano medium	OpenAI	1	6.1	$0.114	9/22	54.9s
Total de testes 22 Testes errados 13 Custo total $0.114 Tempo de resposta (médio) 54.9s
#140	Nemotron 3 Super medium	NVIDIA	1	5.7	$0.050	8/22	52.0s
Total de testes 22 Testes errados 14 Custo total $0.050 Tempo de resposta (médio) 52.0s
#35	Seed-2.0-Lite medium	Bytedance Seed	1	7.9	$0.234	14/22	48.5s
Total de testes 22 Testes errados 8 Custo total $0.234 Tempo de resposta (médio) 48.5s
#102	Laguna XS 2.1 medium	Poolside	1	6.5	$0.068	9/22	47.9s
Total de testes 22 Testes errados 13 Custo total $0.068 Tempo de resposta (médio) 47.9s
#73	Grok 4.3 medium	X AI	1	7.1	$0.779	13/22	47.4s
Total de testes 22 Testes errados 9 Custo total $0.779 Tempo de resposta (médio) 47.4s
#74	GLM 5.1 medium	Z.ai	1	7.1	$0.535	13/22	46.8s
Total de testes 22 Testes errados 9 Custo total $0.535 Tempo de resposta (médio) 46.8s
#172	MiniMax M2.7 medium	Minimax	2	5.0	$0.163	5/22	41.3s
Total de testes 22 Testes errados 17 Custo total $0.163 Tempo de resposta (médio) 41.3s
#134	Mimo V2 Omni medium	Xiaomi	2	5.9	$0.683	10/21	41.2s
Total de testes 21 Testes errados 11 Custo total $0.683 Tempo de resposta (médio) 41.2s

←

1 2 3 4 5

→

Falhas por Sem resposta

Filtrar modelos

Melhores modelos por Contagem de Sem resposta

Contagem de Sem resposta vs Pontuação

Melhores modelos por Tempo de resposta (médio)