AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5.5

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-22

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lançamento: 2026-02-14	GPT-5.5 GPT-5.5 none Lançamento: 2026-04-24

Métrica	Seed-2.0-Lite Seed-2.0-Lite none Lançamento: 2026-02-14	GPT-5.5 GPT-5.5 none Lançamento: 2026-04-24
Pontuação	5.9	6.5
Posição	#99	#86
Confiabilidade	10.0	10.0
Consistência	7.9	8.7
Testes corretos
Taxa de acerto por tentativa	50.0%	56.7%
Testes instáveis	5	3
Execuções totais	60	60
Custo por resultado	0.216	2.165
Custo total	$0.018	$0.217
Preço de entrada	$0.250 / 1M	$5.000 / 1M
Preço de saída	$2.000 / 1M	$30.000 / 1M
Tokens de saída	3,164	1,949
Tokens de raciocínio	0	0
Tempo de resposta (médio)	2.44s	1.94s
Tempo de resposta (máx.)	6.70s	5.56s
Tempo de resposta (total)	48.71s	38.86s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
GPT-5.5	6.9	7.9	66.7%	1		1.31s	213	0

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	6.8	9.9	50.0%	0		2.95s	404	0
GPT-5.5	6.8	10.0	50.0%	0		1.52s	447	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
GPT-5.5	3.0	10.0	0.0%	0		5.56s	300	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
GPT-5.5	10.0	10.0	100.0%	0		1.18s	222	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
GPT-5.5	2.9	7.2	11.1%	1		1.31s	52	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
GPT-5.5	10.0	10.0	100.0%	0		3.41s	124	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
GPT-5.5	6.2	5.8	66.7%	1		1.15s	81	0

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	5.2	4.4	55.6%	2		2.46s	620	0
GPT-5.5	7.7	10.0	66.7%	0		1.36s	245	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
GPT-5.5	10.0	10.0	100.0%	0		3.90s	247	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	11	0
GPT-5.5	3.0	10.0	0.0%	0		5.01s	18	0

Comparação rápida

Trocar par de comparação

Seed-2.0-LitenonevsOwl Alphamedium GPT-5.5nonevsQwen3.6 27Bmedium Seed-2.0-LitenonevsNemotron 3 SupermediumDisponível grátis DeepSeek V4 ProhighvsGPT-5.5none Kimi K2.5mediumvsGPT-5.5none Gemini 3.1 Flash LiteminimalvsGPT-5.5none CobuddymediumDisponível grátisvsSeed-2.0-Litenone GPT-5.5nonevsGrok 4.20medium Seed-2.0-LitenonevsGPT-5 Nanomedium Seed-2.0-Litenonevsgpt-oss-120bmediumDisponível grátis Mercury 2mediumvsGPT-5.5none Seed-2.0-LitenonevsMercury 2medium