Navegação
AI BENCHY
Your ad here

AI BENCHY Compare

MiniMax: MiniMax M2.7 vs StepFun: Step 3.5 Flash

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-18

Métrica MiniMax M2.7 MiniMax M2.7 medium Lançamento: 2026-03-18 Step 3.5 Flash Step 3.5 Flash medium Lançamento: 2026-02-01 Disponível grátis
Pontuação 5.0 7.9
Posição #64 #22
Consistência 5.3 9.1
Testes corretos
Taxa de acerto por tentativa 49.0% 70.6%
Testes instáveis 10 2
Execuções totais 51 49
Custo por resultado 2.398 0.000
Custo total $0.072 $0.000
Preço de entrada $0.300 / 1M $0.000 / 1M
Preço de saída $1.200 / 1M $0.000 / 1M
Tokens de saída 4,517 71,904
Tokens de raciocínio 47,612 155,607
Tempo de resposta (médio) 27.32s 26.78s
Tempo de resposta (máx.) 117.04s 170.45s
Tempo de resposta (total) 437.10s 294.58s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
MiniMax M2.7 7.9 6.3 83.3% 2 40.32s 3,010 17,716
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
MiniMax M2.7 4.7 1.6 66.7% 1 41.03s 369 4,480
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
MiniMax M2.7 6.3 5.8 66.7% 1 21.95s 187 5,882
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
MiniMax M2.7 3.0 10.0 0.0% 0 19.00s 8 2,796
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
MiniMax M2.7 3.9 2.5 33.3% 1 38.70s 92 5,204
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
MiniMax M2.7 3.7 1.8 50.0% 2 12.64s 213 2,457
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
Puzzle Solving Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
MiniMax M2.7 3.8 4.5 33.3% 2 25.62s 334 8,076
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
MiniMax M2.7 4.7 1.6 66.7% 1 12.05s 304 1,001
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

Comparação rápida

Trocar par de comparação