Navegação
AI BENCHY
Advertise here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs xAI: Grok Build 0.1

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-22

Métrica Seed-2.0-Mini Seed-2.0-Mini medium Lançamento: 2026-02-14 Grok Build 0.1 Grok Build 0.1 none Lançamento: 2026-05-21
Pontuação 7.1 6.6
Posição #68 #82
Confiabilidade 5.0 10.0
Consistência 9.2 8.0
Testes corretos
Taxa de acerto por tentativa 60.0% 60.4%
Testes instáveis 2 4
Execuções totais 60 57
Custo por resultado 0.394 7.805
Custo total $0.044 $0.547
Preço de entrada $0.100 / 1M $1.000 / 1M
Preço de saída $0.400 / 1M $2.000 / 1M
Tokens de saída 2,485 267,275
Tokens de raciocínio 95,367 0
Tempo de resposta (médio) 79.17s 28.69s
Tempo de resposta (máx.) 262.83s 138.35s
Tempo de resposta (total) 1345.89s 459.00s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
Grok Build 0.1 8.7 7.9 91.7% 1 6.30s 11,162 0
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 6.8 9.8 50.0% 0 220.48s 464 34,964
Grok Build 0.1 10.0 10.0 100.0% 0 21.41s 16,568 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
Grok Build 0.1 0.0 0.0 0.0% 0 0ms 0 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
Grok Build 0.1 4.7 1.6 66.7% 1 9.33s 6,359 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
Grok Build 0.1 3.6 7.2 22.2% 1 103.71s 179,469 0
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
Grok Build 0.1 4.3 10.0 0.0% 0 12.47s 6,647 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
Grok Build 0.1 9.8 10.0 100.0% 0 7.36s 8,970 0
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 8.2 7.2 88.9% 1 25.85s 457 5,060
Grok Build 0.1 6.4 7.7 55.6% 1 9.55s 14,982 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
Grok Build 0.1 0.0 0.0 0.0% 0 0ms 0 0
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 50 1,779
Grok Build 0.1 3.0 10.0 0.0% 0 36.09s 23,118 0

Comparação rápida

Trocar par de comparação