#63

Step 3.7 Flash

Stepfun रिलीज़: 2026-05-29 परीक्षण किया गया: 2026-06-04 14:10 stepfun/step-3.7-flash::high

(high) (medium) (low)

सारांश

Step 3.7 Flash AI BENCHY पर 7.1 स्कोर करता है और #63 पर है। इसकी reliability 10.0, pass rate 63.5%, कुल लागत $1.148, और औसत response time 64.46s है।

स्कोर

7.1

संगति

8.2

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$1.148

कुल आउटपुट टोकन

991,355

कुल इनपुट टोकन

38,391

इनपुट कीमत

$0.200 / 1M

आउटपुट कीमत

$1.150 / 1M

सही परीक्षण

गलत टेस्ट: 10

प्रति प्रयास पास दर: 63.5%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

64.46s

प्रतिक्रिया समय (अधिकतम): 364.99s

प्रतिक्रिया समय (कुल): 1353.57s

गलत उत्तर: 6 कोई उत्तर नहीं: 4

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#63 Step 3.7 Flash

high

लागत: $0.007
समय: 63.6s
टोकन: 6,030 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	सही परीक्षण	कुल लागत	तुलना करें
2026-06-04 14:10 नया टेस्ट जोड़ा गया	7.0	10.0		$1.148	वर्तमान रन
2026-05-29 11:53 पहला रन	7.1	9.9		$0.960	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-06-04 14:10 · वर्तमान रन	7.1	8.2	10.0	11/21	4	991,355	38,391	$1.148	64.46s
2026-05-29 11:53 · पहला रन	7.1	8.2	9.9	11/20	4	828,084	0	$0.960	49.43s
अंतर	-0.1	0.0	+0.1	0	0	+163271	+38391	+$0.189	+15027ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.200 / 1M	$1.150 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Step 3.7 FlashhighvsClaude Opus 4.8none Step 3.7 FlashhighvsGemma 4 26B A4Bmediumनिःशुल्क उपलब्ध Step 3.7 FlashhighvsQwen3.7 Plusnone Step 3.7 FlashhighvsClaude Sonnet 4.6none Step 3.7 FlashhighvsGLM 5.2none Step 3.7 FlashhighvsGemini 3.5 Flashhigh Step 3.7 FlashhighvsGemini 3 Flash Previewmedium Step 3.7 FlashhighvsNemotron 3 Ultra 550b A55bmediumनिःशुल्क उपलब्ध Step 3.7 FlashhighvsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	10.0	10.0
कोडिंग	4.0	6.0
संयुक्त	10.0	10.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	4.1	4.4
Samanya Buddhimatta	5.5	10.0
निर्देश पालन	9.8	10.0
पहेली समाधान	5.3	7.2
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Step 3.7 Flash

Hamster playing table tennis

#63 Step 3.7 Flash

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल