AI BENCHY
Advertise here

#32

Step 3.5 Flash

Stepfun Lanzamiento: 2026-02-01 Probado el: 2026-05-08 15:30 stepfun/step-3.5-flash::none
(medium) (none)

Modelo archivado: este modelo ya no se actualiza ni se prueba en pruebas nuevas.

Consistencia

10.0

Fiabilidad

10.0

Costo total

$0.020

Total de tokens de salida

64,795

Precio de entrada

$0.090 / 1M

Precio de salida

$0.300 / 1M

Pruebas correctas

Pruebas incorrectas: 3

Tasa de aciertos por intento: 66.7%

Pruebas inestables

0

Pruebas inestables tuvieron resultados mixtos entre ejecuciones (al menos un acierto y un fallo).

Tiempo de respuesta (promedio)

39.03s

Tiempo de respuesta (máximo): 114.12s

Tiempo de respuesta (total): 312.26s

Historial de ejecuciones

Probado el Puntuación Fiabilidad Pruebas correctas Costo total Comparar
2026-05-08 15:30 Prueba nueva añadida 7.8 10.0 $0.020 Ejecución actual
2026-04-11 01:44 Primera ejecución registrada 3.0 N/D $0.000 Comparar

Esta ejecución usó una suite de benchmark diferente. Ten en cuenta los cambios de suite al interpretar la evolución histórica.

Gráficos

Elige el primer modelo y luego haz clic en un segundo modelo para abrir una página lado a lado.

Total de tokens de salida

Puntuación vs Total de tokens de salida

Comparación rápida

Desglose por categoría

Categoría Puntuación Consistencia Pruebas correctas
Trucos anti-IA 10.0 10.0
Programación 3.0 10.0
Combinado 0.0 0.0
Análisis y extracción de datos 0.0 0.0
Específico del dominio 10.0 10.0
Inteligencia general 4.0 10.0
Seguimiento de instrucciones 10.0 10.0
Llamada de herramientas 0.0 0.0
Cultura general 3.0 10.0

Modelos comparados