Navegação
AI BENCHY
Advertise here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs OpenAI: GPT-5.3 Chat

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-04

Métrica Seed-2.0-Mini Seed-2.0-Mini medium Lançamento: 2026-02-14 GPT-5.3 Chat GPT-5.3 Chat none Lançamento: 2026-03-03
Pontuação 6.9 7.2
Posição #73 #63
Confiabilidade 6.7 10.0
Consistência 9.3 8.1
Testes corretos
Taxa de acerto por tentativa 57.1% 66.7%
Testes instáveis 2 5
Execuções totais 63 63
Custo por resultado 0.397 3.605
Custo total $0.044 $0.433
Preço de entrada $0.100 / 1M $1.750 / 1M
Preço de saída $0.400 / 1M $14.000 / 1M
Total de tokens de entrada 41,904 34,209
Tokens de saída 2,555 26,617
Tokens de raciocínio 95,974 0
Tempo de resposta (médio) 80.22s 6.34s
Tempo de resposta (máx.) 262.83s 18.33s
Tempo de resposta (total) 1363.72s 133.13s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 791 360 9,520
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 606 3,167 0
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 5.5 9.8 33.3% 0 220.48s 3,823 464 34,964
GPT-5.3 Chat 5.6 4.7 55.6% 2 10.52s 7,302 6,632 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 16,533 404 29,806
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 11,019 2,614 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 8,568 246 2,743
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 7,140 942 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0 0
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 723 8,264 0
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 585 213 4,210
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 477 319 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 840 69 2,050
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 660 1,491 0
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 8.2 7.2 88.9% 1 31.79s 903 527 5,667
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 642 1,758 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 9,585 222 5,235
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 5,445 861 0
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 276 50 1,779
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 195 569 0

Comparação rápida

Trocar par de comparação