AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5.4 Nano

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-17

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lançamento: 2026-02-14	GPT-5.4 Nano GPT-5.4 Nano medium Lançamento: 2026-03-17

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lançamento: 2026-02-14	GPT-5.4 Nano GPT-5.4 Nano medium Lançamento: 2026-03-17
Posição	#47	#28
Pontuação	6.0	7.4
Consistência	7.6	9.0
Custo por resultado	0.215	0.769
Custo total	$0.016	$0.077
Testes corretos
Taxa de acerto por tentativa	52.9%	66.7%
Testes instáveis	5	2
Execuções totais	51	51
Tokens de saída	2,749	2,474
Tokens de raciocínio	0	54,516
Tempo de resposta (médio)	2.40s	11.08s
Tempo de resposta (máx.)	6.70s	94.06s
Tempo de resposta (total)	40.85s	188.39s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
GPT-5.4 Nano	8.3	10.0	75.0%	0		4.52s	683	2,254

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
GPT-5.4 Nano	9.8	10.0	100.0%	0		24.13s	349	5,719

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
GPT-5.4 Nano	10.0	10.0	100.0%	0		2.54s	234	516

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
GPT-5.4 Nano	5.9	7.2	55.6%	1		38.18s	60	43,325

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
GPT-5.4 Nano	4.5	10.0	0.0%	0		4.15s	179	443

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
GPT-5.4 Nano	9.8	10.0	100.0%	0		1.88s	95	521

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	5.2	4.4	55.6%	2		2.46s	620	0
GPT-5.4 Nano	4.0	7.1	22.2%	1		3.65s	640	1,356

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
GPT-5.4 Nano	10.0	10.0	100.0%	0		7.71s	234	382

Comparação rápida

Trocar par de comparação

Seed-2.0-Litenonevsgpt-oss-120bmediumDisponível grátis Seed-2.0-LitenonevsMiniMax M2.5mediumDisponível grátis Claude Sonnet 4.6nonevsGPT-5.4 Nanomedium Seed-2.0-LitenonevsGrok 4.20 Multi-Agent Betamedium Seed-2.0-LitenonevsGPT-5 Nanomedium Seed-2.0-LitenonevsMercury 2medium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.4 Nanomedium Seed-2.0-LitenonevsMistral Small 4medium Gemini 3 Flash PreviewnonevsGPT-5.4 Nanomedium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.4 Nanomedium GPT-5.4 NanomediumvsQwen3.5 Plus 2026-02-15none GPT-5.4 NanomediumvsGLM 5none