#108

Step 3.5 Flash

Stepfun Lansare: 2026-02-01 Testat la: 2026-04-11 01:44 stepfun/step-3.5-flash::none

(medium) (none)

Rezumat

Step 3.5 Flash obține 3.0 pe AI BENCHY și este pe #108. Are fiabilitate N/D, rată de reușită 0.0%, cost total $0.000 și timp mediu de răspuns 0ms.

Ce face Step 3.5 Flash unic: Costul total al benchmarkului este neobișnuit de mic pentru acest nivel de scor. Este vizibil rapid față de modele similare.

Model arhivat: acest model nu mai este actualizat și nu mai este testat pe teste noi.

Scor

3.0

Consistență

10.0

Fiabilitate

N/D

Cost total (preț curent)

$0.000

Total tokenuri de ieșire

Total tokenuri de intrare

Preț de intrare

$0.100 / 1M

Preț de ieșire

$0.300 / 1M

Teste corecte

Teste greșite: 1

Rată de trecere pe încercare: 0.0%

Teste instabile

Testele instabile au avut rezultate mixte între rulări (cel puțin un succes și un eșec).

Timp de răspuns (mediu)

0ms

Timp de răspuns (maxim): 0ms

Timp de răspuns (total): 0ms

Eroare API: 1

Prezentare generare

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#108 Step 3.5 Flash

none

Cost: $0.005
Timp: 156.3s
Tokenuri: 13,887 tok

Istoric rulări

Testat la	Scor	Fiabilitate	Teste corecte	Cost total	Compară
2026-05-08 15:30 Test nou adăugat	6.6	10.0		$0.020	Compară
2026-04-11 01:44 Prima rulare înregistrată	3.0	N/D		$0.000	Rularea curentă

Comparație între rulări

Rulare	Scor	Consistență	Fiabilitate	Teste corecte	Total tokenuri de ieșire	Total tokenuri de intrare	Cost total	Timp de răspuns (mediu)
2026-04-11 01:44 · Prima rulare înregistrată	3.0	10.0	N/D	0/1	0	0	$0.000	0ms
2026-05-08 15:30 · Test nou adăugat	6.6	10.0	10.0	6/12	64,795	1,971	$0.020	39.03s
Diferență	-3.6	0.0		-6	-64795	-1971	-$0.020	-39032ms