AI BENCHY
Comparar Gráficos Metodologia
❤️ Made by XCS
Your ad here

#13

Step 3.5 Flash

Stepfun · Lançamento: 2026-02-01 · stepfun/step-3.5-flash::medium

Custo por resultado

0.000

Consistência

9.1

Custo total

$0.000

Testes corretos

Testes errados: 6

Taxa de acerto por tentativa: 68.8%

Testes instáveis

2

Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).

Tempo de resposta (médio)

29.10s

Tempo de resposta (máx.): 170.45s

Tempo de resposta (total): 290.96s

Não seguiu as instruções: 3 Resposta incorreta: 3

Gráficos

Escolha o primeiro modelo e depois clique em um segundo modelo para abrir uma página lado a lado.

Comparação rápida

Detalhamento por categoria

Categoria Pontuação média Consistência Testes corretos
Anti-AI Tricks 10.0 10.0
Combined 10.0 10.0
Data parsing and extraction 10.0 10.0
Domain specific 4.0 7.2
General Intelligence 6.0 10.0
Instructions following 9.0 6.8
Puzzle Solving 4.0 10.0
Tool Calling 10.0 10.0