#43
Stepfun
प्रकाशन: 2026-02-01
चाचणी तारीख: 2026-05-08 15:30
stepfun/step-3.5-flash::medium
(medium)
(none)
7.6
सुसंगतता
9.2
10.0
$0.011
एकूण आउटपुट टोकन्स
251,708
एकूण इनपुट टोकन्स
0
इनपुट किंमत
$0.100 / 1M
आउटपुट किंमत
$0.300 / 1M
अस्थिर चाचण्या
2
अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).
रन इतिहास
| चाचणी तारीख | स्कोअर | विश्वसनीयता | बरोबर चाचण्या | एकूण खर्च | तुलना करा |
|---|---|---|---|---|---|
| 2026-05-22 00:30 सूट बदलला | 7.4 | 9.3 | $0.015 | तुलना करा | |
| 2026-05-08 15:30 सूट बदलला | 7.6 | 10.0 | $0.011 | सध्याची रन | |
| 2026-04-11 00:35 पहिली नोंदलेली रन | 7.9 | लागू नाही | $0.000 | तुलना करा |
या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.
चार्ट्स
पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.
स्कोअर vs एकूण खर्च
प्रतिसाद वेळ (सरासरी)
स्कोअर vs प्रतिसाद वेळ (सरासरी)
एकूण आउटपुट टोकन्स
स्कोअर vs एकूण आउटपुट टोकन्स
झटपट तुलना
Step 3.5 FlashmediumvsKimi K2.6mediumमोफत उपलब्धStep 3.5 FlashmediumvsGLM 5.1mediumStep 3.5 FlashmediumvsGemini 3.1 Flash Lite PreviewnoneStep 3.5 FlashmediumvsGPT-5.3 ChatnoneStep 3.5 FlashmediumvsQwen3.5 Plus 2026-04-20mediumStep 3.5 FlashmediumvsMiMo-V2.5mediumStep 3.5 FlashmediumvsGemini 3 Flash PreviewmediumStep 3.5 FlashmediumvsGemini 3.5 FlashhighStep 3.5 FlashmediumvsRing-2.6-1TmediumStep 3.5 FlashmediumvsGemini 3.5 Flashlow
श्रेणीवार तपशील
| श्रेणी | स्कोअर | सुसंगतता | बरोबर चाचण्या |
|---|---|---|---|
| अँटी-एआय युक्त्या | 10.0 | 10.0 | |
| संयुक्त | 10.0 | 10.0 | |
| डेटा पार्सिंग आणि निष्कर्षण | 10.0 | 10.0 | |
| डोमेन-विशिष्ट | 5.3 | 7.2 | |
| Samanya Buddhimatta | 5.5 | 10.0 | |
| सूचनांचे पालन | 8.5 | 6.8 | |
| कोडी सोडवणे | 5.3 | 10.0 | |
| टूल कॉलिंग | 10.0 | 10.0 | |
| सामान्य ज्ञान | 3.0 | 10.0 |