Comparar Gráficos Metodologia

Idioma:

❤️ Made by XCS

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs OpenAI: GPT-5.4

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-06

Métrica	ByteDance Seed: Seed-2.0-Mini medium Lançamento: 2026-02-14	OpenAI: GPT-5.4 none Lançamento: 2026-03-05
Pontuação média	7.0	4.6
Posição	#24	#45
Testes corretos
Consistência	9.4	8.9
Custo por resultado	0.261	1.496
Custo total	$0.027	$0.090
Taxa de acerto por tentativa	71.1%	44.4%
Testes instáveis	1	2
common.totalRuns	45 (15 x 3)	45 (15 x 3)
Tokens de saída	1,752	1,635
Tokens de raciocínio	54,246	0
Tempo de resposta (médio)	67.46s	1.46s
Tempo de resposta (máx.)	262.83s	2.89s
Tempo de resposta (total)	809.49s	21.86s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação média vs Tempo de resposta (médio)

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
ByteDance Seed: Seed-2.0-Mini	7.0	10.0	66.7%	0		98.99s	354	9,352
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	100.0%	0		262.83s	404	29,806
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
ByteDance Seed: Seed-2.0-Mini	9.9	10.0	100.0%	0		24.27s	246	2,743
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	0.0%	0		0ms	0	0
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	100.0%	0		17.47s	69	2,050
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
ByteDance Seed: Seed-2.0-Mini	7.0	7.2	88.9%	1		25.85s	457	5,060
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	100.0%	0		88.68s	222	5,235
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0

Comparação rápida

Trocar par de comparação

Seed-2.0-MinimediumvsGemini 3 Flash Previewnone Claude Sonnet 4.6nonevsSeed-2.0-Minimedium MiniMax M2.5mediumvsGPT-5.4none Seed-2.0-MinimediumvsGemini 3.1 Flash Lite Previewnone Seed-2.0-MinimediumvsGPT-5.3 Chatnone Seed-2.0-MinimediumvsQwen3.5 Plus 2026-02-15none Seed-2.0-MinimediumvsGemini 3.1 Flash Lite Previewlow Seed-2.0-MinimediumvsGPT-5.2 Chatnone Mercury 2mediumvsGPT-5.4none Seed-2.0-MinimediumvsGemini 3.1 Flash Lite Previewhigh Seed-2.0-MinimediumvsGemini 3 Flash Previewlow Seed-2.0-MinimediumvsGLM 5none