Ranking de falhas por Tempo esgotado

Veja quais modelos de IA encontram Tempo esgotado com mais frequência para identificar riscos de confiabilidade antes de escolher. Ordenar por: Tempo de resposta (médio) ↓.

Modelos exibidos

Falhas totais

Modelo mais afetado

Step 3.5 Flash 1

Categorias

Na categoria Específico do domínio43 Na categoria Programação26 Na categoria Combinado5 Na categoria Resolução de quebra-cabeças5 Na categoria Inteligência geral4 Na categoria Truques anti-IA4 Na categoria Análise e extração de dados1 Na categoria Seguimento de instruções1

44/44

Posição	Modelo	Empresa	Contagem de Tempo esgotado	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#204	Qwen3.5-9B medium	Qwen	12	3.8	$0.036	3/22	82.2s
Total de testes 22 Testes errados 19 Custo total $0.036 Tempo de resposta (médio) 82.2s
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
Total de testes 22 Testes errados 12 Custo total $0.200 Tempo de resposta (médio) 79.1s
#110	Gemma 4 31B medium	Google	2	6.3	$0.163	14/22	75.4s
Total de testes 22 Testes errados 8 Custo total $0.163 Tempo de resposta (médio) 75.4s
#47	MiniMax M3 medium	Minimax	3	7.6	$0.286	12/22	75.0s
Total de testes 22 Testes errados 10 Custo total $0.286 Tempo de resposta (médio) 75.0s
#76	DeepSeek V3.2 medium	DeepSeek	2	7.0	$0.078	11/22	68.6s
Total de testes 22 Testes errados 11 Custo total $0.078 Tempo de resposta (médio) 68.6s
#190	MiniMax M2.5 medium	Minimax	4	4.6	$0.340	5/22	68.3s
Total de testes 22 Testes errados 17 Custo total $0.340 Tempo de resposta (médio) 68.3s
#19	Qwen3.6 Max Preview medium	Qwen	1	8.4	$1.143	16/22	67.5s
Total de testes 22 Testes errados 6 Custo total $1.143 Tempo de resposta (médio) 67.5s
#72	Qwen3.5-122B-A10B medium	Qwen	2	7.1	$1.046	14/22	64.2s
Total de testes 22 Testes errados 8 Custo total $1.046 Tempo de resposta (médio) 64.2s
#31	GLM 5.2 high	Z.ai	3	8.0	$0.970	14/22	62.7s
Total de testes 22 Testes errados 8 Custo total $0.970 Tempo de resposta (médio) 62.7s
#128	GPT-5 Nano medium	OpenAI	1	6.1	$0.114	9/22	54.9s
Total de testes 22 Testes errados 13 Custo total $0.114 Tempo de resposta (médio) 54.9s
#140	Nemotron 3 Super medium	NVIDIA	1	5.7	$0.050	8/22	52.0s
Total de testes 22 Testes errados 14 Custo total $0.050 Tempo de resposta (médio) 52.0s
#36	Qwen3.7 Plus medium	Qwen	1	7.9	$0.267	15/22	51.5s
Total de testes 22 Testes errados 7 Custo total $0.267 Tempo de resposta (médio) 51.5s
#74	GLM 5.1 medium	Z.ai	2	7.1	$0.535	13/22	46.8s
Total de testes 22 Testes errados 9 Custo total $0.535 Tempo de resposta (médio) 46.8s
#70	Qwen3.5 Plus 2026-04-20 medium	Qwen	1	7.2	$0.317	13/22	46.4s
Total de testes 22 Testes errados 9 Custo total $0.317 Tempo de resposta (médio) 46.4s
#172	MiniMax M2.7 medium	Minimax	2	5.0	$0.163	5/22	41.3s
Total de testes 22 Testes errados 17 Custo total $0.163 Tempo de resposta (médio) 41.3s

Falhas por Tempo esgotado

Filtrar modelos

Melhores modelos por Contagem de Tempo esgotado

Contagem de Tempo esgotado vs Pontuação

Melhores modelos por Tempo de resposta (médio)