AI BENCHY
Advertise here

#108

Step 3.5 Flash

Stepfun Sortie: 2026-02-01 Testé le: 2026-04-11 01:44 stepfun/step-3.5-flash::none
(medium) (none)

Modèle archivé : ce modèle n'est plus mis à jour ni testé sur de nouveaux tests.

Score

3.0

Cohérence

10.0

Fiabilité

N/D

Coût total

$0.000

Total des jetons de sortie

0

Prix d'entrée

$0.100 / 1M

Prix de sortie

$0.300 / 1M

Tests corrects

Tests incorrects: 1

Taux de réussite par tentative: 0.0%

Tests instables

0

Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).

Temps de réponse (moy.)

0ms

Temps de réponse (max): 0ms

Temps de réponse (total): 0ms

Historique des runs

Testé le Score Fiabilité Tests corrects Coût total Comparer
2026-05-08 15:30 Nouveau test ajouté 7.8 10.0 $0.020 Comparer
2026-04-11 01:44 Première exécution enregistrée 3.0 N/D $0.000 Exécution actuelle

Comparaison de runs

RunScoreCohérenceFiabilitéTests correctsTests instablesTotal des jetons de sortieCoût totalTemps de réponse (moy.)
2026-04-11 01:44 · Première exécution enregistrée3.010.0N/D0/100$0.0000ms
2026-05-08 15:30 · Nouveau test ajouté7.810.010.06/9064,795$0.02039.03s
Différence-4.80.0-90-64795-$0.020-39032ms

Ces deux runs ont utilisé des suites de benchmark différentes, donc les écarts reflètent à la fois les changements du modèle et ceux de la suite.

Graphiques

Choisissez d'abord le premier modèle, puis cliquez sur un second modèle pour ouvrir une page côte à côte.

Total des jetons de sortie

Score vs Total des jetons de sortie

Comparaison rapide

Répartition par catégorie

Catégorie Score Cohérence Tests corrects
Programmation 3.0 10.0

Modèles comparés