#34
Stepfun
प्रकाशन: 2026-02-01
चाचणी तारीख: 2026-04-11 00:35
stepfun/step-3.5-flash::medium
(medium)
(none)
7.9
सुसंगतता
9.1
लागू नाही
$0.000
एकूण आउटपुट टोकन्स
227,511
एकूण इनपुट टोकन्स
0
इनपुट किंमत
$0.100 / 1M
आउटपुट किंमत
$0.300 / 1M
अस्थिर चाचण्या
2
अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).
रन इतिहास
| चाचणी तारीख | स्कोअर | विश्वसनीयता | बरोबर चाचण्या | एकूण खर्च | तुलना करा |
|---|---|---|---|---|---|
| 2026-05-22 00:30 सूट बदलला | 7.4 | 9.3 | $0.015 | तुलना करा | |
| 2026-05-08 15:30 सूट बदलला | 7.6 | 10.0 | $0.011 | तुलना करा | |
| 2026-04-11 00:35 पहिली नोंदलेली रन | 7.9 | लागू नाही | $0.000 | सध्याची रन |
रन तुलना
| रन | स्कोअर | सुसंगतता | विश्वसनीयता | बरोबर चाचण्या | अस्थिर चाचण्या | एकूण आउटपुट टोकन्स | एकूण इनपुट टोकन्स | एकूण खर्च | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|---|---|---|
| 2026-04-11 00:35 · पहिली नोंदलेली रन | 7.9 | 9.1 | लागू नाही | 11/17 | 2 | 227,511 | 0 | $0.000 | 26.78s |
| 2026-05-22 00:30 · सूट बदलला | 7.4 | 8.7 | 9.3 | 11/19 | 3 | 263,806 | 0 | $0.015 | 43.29s |
| फरक | +0.5 | +0.4 | 0 | -1 | -36295 | 0 | -$0.015 | -16508ms |
या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.
चार्ट्स
पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.
स्कोअर vs एकूण खर्च
प्रतिसाद वेळ (सरासरी)
स्कोअर vs प्रतिसाद वेळ (सरासरी)
एकूण आउटपुट टोकन्स
स्कोअर vs एकूण आउटपुट टोकन्स
झटपट तुलना
Step 3.5 FlashmediumvsKimi K2.6mediumमोफत उपलब्धStep 3.5 FlashmediumvsGLM 5.1mediumStep 3.5 FlashmediumvsGemini 3.1 Flash Lite PreviewnoneStep 3.5 FlashmediumvsGPT-5.3 ChatnoneStep 3.5 FlashmediumvsQwen3.5 Plus 2026-04-20mediumStep 3.5 FlashmediumvsMiMo-V2.5mediumStep 3.5 FlashmediumvsGemini 3 Flash PreviewmediumStep 3.5 FlashmediumvsGemini 3.5 FlashhighStep 3.5 FlashmediumvsRing-2.6-1TmediumStep 3.5 FlashmediumvsGemini 3.5 Flashlow
श्रेणीवार तपशील
| श्रेणी | स्कोअर | सुसंगतता | बरोबर चाचण्या |
|---|---|---|---|
| अँटी-एआय युक्त्या | 10.0 | 10.0 | |
| संयुक्त | 10.0 | 10.0 | |
| डेटा पार्सिंग आणि निष्कर्षण | 10.0 | 10.0 | |
| डोमेन-विशिष्ट | 5.3 | 7.2 | |
| Samanya Buddhimatta | 5.5 | 10.0 | |
| सूचनांचे पालन | 8.5 | 6.8 | |
| कोडी सोडवणे | 5.3 | 10.0 | |
| टूल कॉलिंग | 10.0 | 10.0 |