#187

Step 3.5 Flash

Stepfun प्रकाशन: 2026-02-01 चाचणी तारीख: 2026-05-08 15:30 stepfun/step-3.5-flash::none

(medium) (none)

सारांश

Step 3.5 Flash AI BENCHY वर 2.6 स्कोर करते आणि #187 वर आहे. याची reliability 10.0, pass rate 28.6%, एकूण खर्च $0.020, आणि सरासरी response time 39.03s आहे.

Step 3.5 Flash खास का आहे: या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे.

संग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.

स्कोअर

2.6

सुसंगतता

5.7

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.020

एकूण आउटपुट टोकन्स

64,795

एकूण इनपुट टोकन्स

1,971

इनपुट किंमत

$0.100 / 1M

आउटपुट किंमत

$0.300 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 6

प्रति प्रयत्न पास दर: 28.6%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

39.03s

प्रतिसाद वेळ (कमाल): 114.12s

प्रतिसाद वेळ (एकूण): 312.26s

API त्रुटी: 4 सूचनांचे पालन केले नाही: 1 चुकीचे उत्तर: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#187 Step 3.5 Flash

none

खर्च: $0.005
वेळ: 156.3s
टोकन्स: 13,887 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	बरोबर चाचण्या	एकूण खर्च	तुलना करा
2026-05-08 15:30 नवीन चाचणी जोडली	6.6	10.0		$0.020	सध्याची रन
2026-04-11 01:44 पहिली नोंदलेली रन	3.0	लागू नाही		$0.000	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	एकूण आउटपुट टोकन्स	एकूण इनपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-05-08 15:30 · सध्याची रन	2.6	5.7	10.0	6/12	64,795	1,971	$0.020	39.03s
2026-04-11 01:44 · पहिली नोंदलेली रन	3.0	10.0	लागू नाही	0/1	0	0	$0.000	0ms
फरक	-0.4	-4.3		+6	+64795	+1971	+$0.020	+39032ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख	इनपुट किंमत	आउटपुट किंमत
2026-06-04 15:40	$0.090 / 1M	$0.300 / 1M
2026-06-30 21:25	$0.100 / 1M	$0.300 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Step 3.5 FlashnonevsGemini 3.5 Flashhigh Step 3.5 FlashnonevsGemini 3 Flash Previewmedium Step 3.5 FlashnonevsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध Step 3.5 FlashnonevsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	10.0	10.0
कोडिंग	9.8	3.3
संयुक्त	3.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	1.5	5.0
डोमेन-विशिष्ट	3.3	3.3
Samanya Buddhimatta	4.0	10.0
सूचनांचे पालन	5.0	5.0
कोडी सोडवणे	0.0	0.0
टूल कॉलिंग	3.0	10.0
सामान्य ज्ञान	3.0	10.0

Step 3.5 Flash

Hamster playing table tennis

#187 Step 3.5 Flash

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स