AI BENCHY
Advertise here

#34

Step 3.5 Flash

Stepfun Releasedatum: 2026-02-01 Getest op: 2026-04-11 00:35 stepfun/step-3.5-flash::medium
(medium) (none)

Score

7.9

Consistentie

9.1

Betrouwbaarheid

n.v.t.

Totaal aantal uitvoer-tokens

227,511

Totaal aantal invoer-tokens

0

Invoerprijs

$0.100 / 1M

Uitvoerprijs

$0.300 / 1M

Correcte tests

Foute tests: 6

Slaagpercentage per poging: 70.6%

Instabiele tests

2

Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).

Responstijd (gem.)

26.78s

Responstijd (max): 170.45s

Responstijd (totaal): 294.58s

Rungeschiedenis

Getest op Score Betrouwbaarheid Correcte tests Totale kosten Vergelijken
2026-05-22 00:30 Suite gewijzigd 7.4 9.3 $0.015 Vergelijken
2026-05-08 15:30 Suite gewijzigd 7.6 10.0 $0.011 Vergelijken
2026-04-11 00:35 Eerste geregistreerde run 7.9 n.v.t. $0.000 Huidige run

Grafieken

Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Snelle vergelijking

Categorie-uitsplitsing

Categorie Score Consistentie Correcte tests
Anti-AI-trucs 10.0 10.0
Gecombineerd 10.0 10.0
Gegevensparsering en extractie 10.0 10.0
Domeinspecifiek 5.3 7.2
Algemene intelligentie 5.5 10.0
Instructies opvolgen 8.5 6.8
Puzzeloplossing 5.3 10.0
Toolaanroepen 10.0 10.0

Vergeleken modellen