#13
Stepfun · रिलीज़: 2026-02-01 · stepfun/step-3.5-flash::medium
अस्थिर टेस्ट
2
अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।
निर्देशों का पालन नहीं किया: 3 गलत उत्तर: 3
चार्ट
पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।
त्वरित तुलना
Step 3.5 Flashmediumनिःशुल्क उपलब्धvsGemini 3.1 Flash Lite PreviewmediumStep 3.5 Flashmediumनिःशुल्क उपलब्धvsGLM 5mediumStep 3.5 Flashmediumनिःशुल्क उपलब्धvsClaude Sonnet 4.6mediumStep 3.5 Flashmediumनिःशुल्क उपलब्धvsGPT-5.2 ChatnoneStep 3.5 Flashmediumनिःशुल्क उपलब्धvsQwen3.5-122B-A10BmediumStep 3.5 Flashmediumनिःशुल्क उपलब्धvsGemini 2.5 FlashmediumStep 3.5 Flashmediumनिःशुल्क उपलब्धvsGemini 3 Flash PreviewmediumStep 3.5 Flashmediumनिःशुल्क उपलब्धvsGemini 3.1 Pro PreviewmediumStep 3.5 Flashmediumनिःशुल्क उपलब्धvsTrinity Large Previewnoneनिःशुल्क उपलब्ध
श्रेणी विवरण
| श्रेणी | औसत स्कोर | संगति | सही परीक्षण |
|---|---|---|---|
| Anti-AI Tricks | 10.0 | 10.0 | |
| Combined | 10.0 | 10.0 | |
| Data parsing and extraction | 10.0 | 10.0 | |
| Domain specific | 4.0 | 7.2 | |
| General Intelligence | 6.0 | 10.0 | |
| Instructions following | 9.0 | 6.8 | |
| Puzzle Solving | 4.0 | 10.0 | |
| Tool Calling | 10.0 | 10.0 |