#13
Stepfun · Lançamento: 2026-02-01 · stepfun/step-3.5-flash::medium
Testes instáveis
2
Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).
29.10s
Tempo de resposta (máx.): 170.45s
Tempo de resposta (total): 290.96s
Não seguiu as instruções: 3 Resposta incorreta: 3
Gráficos
Escolha o primeiro modelo e depois clique em um segundo modelo para abrir uma página lado a lado.
Comparação rápida
Step 3.5 FlashmediumDisponível grátisvsGemini 3.1 Flash Lite PreviewmediumStep 3.5 FlashmediumDisponível grátisvsGLM 5mediumStep 3.5 FlashmediumDisponível grátisvsClaude Sonnet 4.6mediumStep 3.5 FlashmediumDisponível grátisvsGPT-5.2 ChatnoneStep 3.5 FlashmediumDisponível grátisvsQwen3.5-122B-A10BmediumStep 3.5 FlashmediumDisponível grátisvsGemini 2.5 FlashmediumStep 3.5 FlashmediumDisponível grátisvsGemini 3 Flash PreviewmediumStep 3.5 FlashmediumDisponível grátisvsGemini 3.1 Pro PreviewmediumStep 3.5 FlashmediumDisponível grátisvsTrinity Large PreviewnoneDisponível grátis
Detalhamento por categoria
| Categoria | Pontuação média | Consistência | Testes corretos |
|---|---|---|---|
| Anti-AI Tricks | 10.0 | 10.0 | |
| Combined | 10.0 | 10.0 | |
| Data parsing and extraction | 10.0 | 10.0 | |
| Domain specific | 4.0 | 7.2 | |
| General Intelligence | 6.0 | 10.0 | |
| Instructions following | 9.0 | 6.8 | |
| Puzzle Solving | 4.0 | 10.0 | |
| Tool Calling | 10.0 | 10.0 |