AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5.4

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-03

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lançamento: 2026-02-14	GPT-5.4 GPT-5.4 none Lançamento: 2026-03-05

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lançamento: 2026-02-14	GPT-5.4 GPT-5.4 none Lançamento: 2026-03-05
Pontuação	5.9	5.6
Posição	#106	#121
Confiabilidade	10.0	10.0
Consistência	8.3	9.1
Testes corretos
Taxa de acerto por tentativa	48.3%	38.3%
Testes instáveis	4	2
Execuções totais	60	60
Custo por resultado	0.218	1.644
Custo total	$0.018	$0.116
Preço de entrada	$0.250 / 1M	$2.500 / 1M
Preço de saída	$2.000 / 1M	$15.000 / 1M
Total de tokens de entrada	43,630	31,593
Tokens de saída	3,253	2,402
Tokens de raciocínio	0	0
Tempo de resposta (médio)	2.48s	1.45s
Tempo de resposta (máx.)	6.70s	2.95s
Tempo de resposta (total)	49.67s	29.00s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	894	709	0
GPT-5.4	3.2	8.0	8.3%	1		1.21s	606	406	0

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	6.8	9.9	50.0%	0		2.95s	5,272	404	0
GPT-5.4	6.8	10.0	50.0%	0		1.99s	4,686	501	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	16,215	498	0
GPT-5.4	3.0	10.0	0.0%	0		2.89s	11,019	291	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	8,538	246	0
GPT-5.4	10.0	10.0	100.0%	0		1.04s	7,140	222	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	939	17	0
GPT-5.4	5.3	7.2	44.4%	1		1.07s	723	50	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	570	294	0
GPT-5.4	4.4	9.9	0.0%	0		1.78s	477	184	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	810	73	0
GPT-5.4	6.5	10.0	50.0%	0		1.07s	660	81	0

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	5.3	7.2	44.4%	1		2.78s	858	709	0
GPT-5.4	5.6	9.8	33.3%	0		1.44s	642	381	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	9,270	292	0
GPT-5.4	10.0	10.0	100.0%	0		2.75s	5,445	246	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	264	11	0
GPT-5.4	3.0	10.0	0.0%	0		990ms	195	40	0

Comparação rápida

Trocar par de comparação

Seed-2.0-LitenonevsOwl Alphamedium Seed-2.0-Litenonevsgpt-oss-120bmediumDisponível grátis Seed-2.0-LitenonevsNemotron 3 SupermediumDisponível grátis MiniMax M2.5mediumvsGPT-5.4none CobuddymediumvsSeed-2.0-Litenone CobuddymediumvsGPT-5.4none MiniMax M2.7mediumvsGPT-5.4none Mistral Small 4mediumvsGPT-5.4none Seed-2.0-LitenonevsDeepSeek V4 Prohigh Seed-2.0-LitenonevsGPT-5 Nanomedium GPT-5.4nonevsOwl Alphamedium GPT-5.4nonevsElephant Alphamedium