AI BENCHY
Your ad here

#30

Step 3.5 Flash

Stepfun · Releasedatum: 2026-02-01 · stepfun/step-3.5-flash::medium

Score

7.9

Consistentie

9.1

Totale kosten

$0.000

Totaal aantal uitvoer-tokens

227,511

Invoerprijs

$0.100 / 1M

Uitvoerprijs

$0.300 / 1M

Correcte tests

Foute tests: 6

Slaagpercentage per poging: 70.6%

Instabiele tests

2

Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).

Responstijd (gem.)

26.78s

Responstijd (max): 170.45s

Responstijd (totaal): 294.58s

Grafieken

Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Snelle vergelijking

Categorie-uitsplitsing

Categorie Score Consistentie Correcte tests
Anti-AI-trucs 10.0 10.0
Gecombineerd 10.0 10.0
Gegevensparsering en extractie 10.0 10.0
Domeinspecifiek 5.3 7.2
Algemene intelligentie 5.5 10.0
Instructies opvolgen 8.5 6.8
Puzzeloplossing 5.3 10.0
Toolaanroepen 10.0 10.0

Vergeleken modellen