ByteDance Seed: Seed-2.0-Mini vs OpenAI: GPT-5.5

Seed-2.0-Mini (medium) lidera na pontuação média com 7.0 vs 6.9. Seed-2.0-Mini (medium) tem menor custo de benchmark com $0.101 vs $0.544. GPT-5.5 é mais rápido com 2.36s vs 92.53s, com taxas de acerto de 57.6% vs 56.1%.

Modelo recomendadoGPT-5.5A pontuação fica perto da melhor aqui (6.9 vs 7.0) e responde cerca de 39.2x mais rápido que Seed-2.0-Mini (medium).

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-07-24

Métrica	Seed-2.0-Mini Seed-2.0-Mini medium Lançamento: 2026-02-14	GPT-5.5 GPT-5.5 none Lançamento: 2026-04-24

Métrica	Seed-2.0-Mini Seed-2.0-Mini medium Lançamento: 2026-02-14	GPT-5.5 GPT-5.5 none Lançamento: 2026-04-24
Pontuação	7.0	6.9
Posição	#84	#91
Confiabilidade	8.5	10.0
Consistência	8.9	8.9
Testes corretos
Taxa de acerto por tentativa	57.6%	56.1%
Testes instáveis	3	3
Execuções totais	66	66
Custo por resultado	0.917	4.945
Custo total	$0.101	$0.544
Preço de entrada	$0.100 / 1M	$5.000 / 1M
Preço de saída	$0.400 / 1M	$30.000 / 1M
Total de tokens de entrada	125,467	79,285
Tokens de saída	10,778	4,915
Tokens de raciocínio	209,856	0
Tempo de resposta (médio)	92.53s	2.36s
Tempo de resposta (máx.)	301.78s	12.24s
Tempo de resposta (total)	1665.50s	51.88s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#84 Seed-2.0-Mini

medium

Custo: $0.002
Tempo: 161.7s
Tokens: 4,379 tok

#91 GPT-5.5

none

Custo: $0.090
Tempo: 54.3s
Tokens: 3,063 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Categoria:

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Mini	6.6	10.0	50.0%	0		74.75s	791	360	9,520
GPT-5.5	6.9	7.9	66.7%	1		1.31s	606	213	0

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Mini	5.5	9.8	33.3%	0		220.48s	3,823	464	34,964
GPT-5.5	5.5	10.0	33.3%	0		1.35s	7,305	462	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Mini	7.3	5.8	83.3%	1		282.30s	100,096	8,627	143,688
GPT-5.5	6.5	10.0	50.0%	0		8.90s	56,092	3,244	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Mini	10.0	10.0	100.0%	0		24.27s	8,568	246	2,743
GPT-5.5	10.0	10.0	100.0%	0		1.18s	7,140	222	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Mini	3.0	10.0	0.0%	0		0ms	0	0	0
GPT-5.5	2.9	7.2	11.1%	1		1.31s	723	52	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Mini	5.1	3.4	33.3%	1		36.65s	585	213	4,210
GPT-5.5	10.0	10.0	100.0%	0		3.41s	477	124	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Mini	10.0	10.0	100.0%	0		17.47s	840	69	2,050
GPT-5.5	6.2	5.8	66.7%	1		1.15s	660	81	0

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Mini	8.2	7.2	88.9%	1		31.79s	903	527	5,667
GPT-5.5	7.7	10.0	66.7%	0		1.29s	642	252	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Mini	10.0	10.0	100.0%	0		88.68s	9,585	222	5,235
GPT-5.5	10.0	10.0	100.0%	0		3.90s	5,445	247	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Seed-2.0-Mini	3.0	10.0	0.0%	0		56.76s	276	50	1,779
GPT-5.5	3.0	10.0	0.0%	0		5.01s	195	18	0

Comparação rápida

Trocar par de comparação

GPT-5.5nonevsStep 3.7 Flashhigh GPT-5.5nonevsQwen3.6 Flashmedium Seed-2.0-MinimediumvsGemini 3.5 Flashnone GPT-5.5nonevsMiMo-V2.5-Promedium Gemini 3.5 FlashminimalvsGPT-5.5none Seed-2.0-MinimediumvsDeepSeek V4 Pronone Seed-2.0-MinimediumvsGPT-5.6 Solnone KAT-Coder-Pro V2.5mediumvsGPT-5.5none Seed-2.0-MinimediumvsStep 3.7 Flashhigh GPT-5.5nonevsQwen3.6 35B A3Bmedium Mercury 2mediumvsGPT-5.5none Kimi K2.5mediumvsGPT-5.5none