AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5.4 Mini

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-17

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lançamento: 2026-02-14	GPT-5.4 Mini GPT-5.4 Mini medium Lançamento: 2026-03-17

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lançamento: 2026-02-14	GPT-5.4 Mini GPT-5.4 Mini medium Lançamento: 2026-03-17
Posição	#47	#34
Pontuação	6.0	7.1
Consistência	7.6	7.2
Custo por resultado	0.215	3.610
Custo total	$0.016	$0.289
Testes corretos
Taxa de acerto por tentativa	52.9%	68.6%
Testes instáveis	5	6
Execuções totais	51	51
Tokens de saída	2,749	1,708
Tokens de raciocínio	0	58,019
Tempo de resposta (médio)	2.40s	15.66s
Tempo de resposta (máx.)	6.70s	102.91s
Tempo de resposta (total)	40.85s	266.14s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
GPT-5.4 Mini	8.6	7.9	91.7%	1		4.05s	296	2,876

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
GPT-5.4 Mini	10.0	10.0	100.0%	0		17.81s	317	4,317

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
GPT-5.4 Mini	10.0	10.0	100.0%	0		2.43s	234	650

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
GPT-5.4 Mini	4.1	4.4	44.5%	2		65.31s	60	43,286

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
GPT-5.4 Mini	4.5	10.0	0.0%	0		3.72s	150	510

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
GPT-5.4 Mini	7.4	6.5	66.7%	1		2.50s	129	1,337

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	5.2	4.4	55.6%	2		2.46s	620	0
GPT-5.4 Mini	6.8	7.9	55.6%	1		4.33s	271	2,449

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
GPT-5.4 Mini	4.7	1.6	66.7%	1		9.62s	251	2,594

Comparação rápida

Trocar par de comparação

Seed-2.0-Litenonevsgpt-oss-120bmediumDisponível grátis Seed-2.0-LitenonevsMiniMax M2.5mediumDisponível grátis Claude Sonnet 4.6nonevsGPT-5.4 Minimedium Seed-2.0-LitenonevsGrok 4.20 Multi-Agent Betamedium Seed-2.0-LitenonevsGPT-5 Nanomedium Seed-2.0-LitenonevsMercury 2medium GPT-5.4 MinimediumvsQwen3.5 Plus 2026-02-15none GPT-5.4 MinimediumvsGLM 5none Seed-2.0-LitenonevsMistral Small 4medium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.4 Minimedium DeepSeek V3.2nonevsGPT-5.4 Minimedium Seed-2.0-LitenonevsGPT-5 Minimedium