AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.6 35B A3B

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-27

Métrica	Seed-2.0-Lite Seed-2.0-Lite medium Lançamento: 2026-02-14	Qwen3.6 35B A3B Qwen3.6 35B A3B medium Lançamento: 2026-04-20

Métrica	Seed-2.0-Lite Seed-2.0-Lite medium Lançamento: 2026-02-14	Qwen3.6 35B A3B Qwen3.6 35B A3B medium Lançamento: 2026-04-20
Pontuação	8.6	8.8
Posição	#10	#9
Confiabilidade	N/D	10.0
Consistência	8.8	9.5
Testes corretos
Taxa de acerto por tentativa	83.3%	83.3%
Testes instáveis	3	1
Execuções totais	54	54
Custo por resultado	0.926	0.800
Custo total	$0.121	$0.104
Preço de entrada	$0.250 / 1M	$0.162 / 1M
Preço de saída	$2.000 / 1M	$0.966 / 1M
Tokens de saída	3,257	14,256
Tokens de raciocínio	52,042	98,005
Tempo de resposta (médio)	30.37s	11.98s
Tempo de resposta (máx.)	168.71s	45.02s
Tempo de resposta (total)	546.72s	191.76s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	996	7,142
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		6.02s	1,154	12,385

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		74.49s	436	7,319
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		32.58s	3,294	15,116

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	506	4,299
Qwen3.6 35B A3B	0.0	0.0	0.0%	0		0ms	0	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	246	1,742
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		12.99s	2,591	9,968

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	15	23,897
Qwen3.6 35B A3B	5.3	7.2	44.4%	1		22.50s	6,193	39,116

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	304	1,620
Qwen3.6 35B A3B	4.4	9.9	0.0%	0		8.66s	129	4,569

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	71	1,480
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		7.50s	219	7,404

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	9.0	7.9	88.9%	1		11.03s	461	3,532
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		5.98s	676	9,447

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	222	1,011
Qwen3.6 35B A3B	0.0	0.0	0.0%	0		0ms	0	0

Comparação rápida

Trocar par de comparação

Gemini 3 Flash PreviewlowvsQwen3.6 35B A3Bmedium Seed-2.0-LitemediumvsHY3 PreviewhighDisponível grátis Seed-2.0-LitemediumvsGemini 3 Flash Previewlow GPT-5.5lowvsQwen3.6 35B A3Bmedium Qwen3.6 35B A3BmediumvsHY3 PreviewhighDisponível grátis Claude Opus 4.7nonevsQwen3.6 35B A3Bmedium Seed-2.0-LitemediumvsGPT-5.5low Seed-2.0-LitemediumvsHY3 PreviewlowDisponível grátis Seed-2.0-LitemediumvsGemini 3 Flash Previewnone Seed-2.0-LitemediumvsGemini 3.1 Flash Lite Previewlow Claude Opus 4.7nonevsSeed-2.0-Litemedium Qwen3.6 35B A3BmediumvsHY3 PreviewlowDisponível grátis