#108
Stepfun
Lançamento: 2026-02-01
Testado em: 2026-04-11 01:44
stepfun/step-3.5-flash::none
(medium)
(none)
Modelo arquivado: este modelo não é mais atualizado nem testado em novos testes.
Preço de entrada
$0.100 / 1M
Preço de saída
$0.300 / 1M
Testes instáveis
0
Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).
Histórico de execuções
| Testado em | Pontuação | Confiabilidade | Testes corretos | Custo total | Comparar |
|---|---|---|---|---|---|
| 2026-05-08 15:30 Novo teste adicionado | 7.8 | 10.0 | $0.020 | Comparar | |
| 2026-04-11 01:44 Primeira execução registrada | 3.0 | N/D | $0.000 | Execução atual |
Comparação de execuções
| Execução | Pontuação | Consistência | Confiabilidade | Testes corretos | Testes instáveis | Total de tokens de saída | Custo total | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-11 01:44 · Primeira execução registrada | 3.0 | 10.0 | N/D | 0/1 | 0 | 0 | $0.000 | 0ms |
| 2026-05-08 15:30 · Novo teste adicionado | 7.8 | 10.0 | 10.0 | 6/9 | 0 | 64,795 | $0.020 | 39.03s |
| Diferença | -4.8 | 0.0 | -9 | 0 | -64795 | -$0.020 | -39032ms |
Estas duas execuções usaram suites de benchmark diferentes, então as diferenças refletem tanto mudanças do modelo quanto da suite.
Gráficos
Escolha o primeiro modelo e depois clique em um segundo modelo para abrir uma página lado a lado.
Pontuação vs Custo total
Tempo de resposta (médio)
Pontuação vs Tempo de resposta (médio)
Total de tokens de saída
Pontuação vs Total de tokens de saída
Comparação rápida
Detalhamento por categoria
| Categoria | Pontuação | Consistência | Testes corretos |
|---|---|---|---|
| Programação | 3.0 | 10.0 |