AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs DeepSeek: DeepSeek V3.2

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-01

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lançamento: 2026-02-14	DeepSeek V3.2 DeepSeek V3.2 none Lançamento: 2025-12-01

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lançamento: 2026-02-14	DeepSeek V3.2 DeepSeek V3.2 none Lançamento: 2025-12-01
Pontuação	5.9	5.6
Posição	#106	#120
Confiabilidade	10.0	10.0
Consistência	8.3	8.3
Testes corretos
Taxa de acerto por tentativa	48.3%	41.7%
Testes instáveis	4	6
Execuções totais	60	60
Custo por resultado	0.218	0.222
Custo total	$0.018	$0.018
Preço de entrada	$0.250 / 1M	$0.252 / 1M
Preço de saída	$2.000 / 1M	$0.378 / 1M
Tokens de saída	3,253	11,159
Tokens de raciocínio	0	0
Tempo de resposta (médio)	2.48s	14.43s
Tempo de resposta (máx.)	6.70s	115.89s
Tempo de resposta (total)	49.67s	288.55s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
DeepSeek V3.2	3.2	8.2	8.3%	1		9.35s	1,073	0

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	6.8	9.9	50.0%	0		2.95s	404	0
DeepSeek V3.2	3.1	5.4	16.7%	1		20.87s	4,522	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
DeepSeek V3.2	2.9	6.9	11.1%	1		4.17s	21	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
DeepSeek V3.2	6.8	10.0	66.7%	1		9.32s	43	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	5.3	7.2	44.4%	1		2.78s	709	0
DeepSeek V3.2	8.3	10.0	77.8%	1		6.91s	298	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	11	0
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	17	0

Comparação rápida

Trocar par de comparação

Seed-2.0-LitenonevsOwl Alphamedium Seed-2.0-Litenonevsgpt-oss-120bmediumDisponível grátis Seed-2.0-LitenonevsNemotron 3 SupermediumDisponível grátis DeepSeek V3.2nonevsMiniMax M2.5medium CobuddymediumvsSeed-2.0-Litenone DeepSeek V3.2nonevsMistral Small 4medium CobuddymediumvsDeepSeek V3.2none DeepSeek V3.2nonevsElephant Alphamedium DeepSeek V3.2nonevsMiniMax M2.7medium Seed-2.0-LitenonevsGPT-5 Nanomedium DeepSeek V3.2nonevsOwl Alphamedium DeepSeek V3.2nonevsgpt-oss-120bmediumDisponível grátis