AI BENCHY
तुलना करें चार्ट Karyapranali
❤️ Made by XCS
Your ad here

#13

Step 3.5 Flash

Stepfun · रिलीज़: 2026-02-01 · stepfun/step-3.5-flash::medium

प्रति परिणाम लागत

0.000

संगति

9.1

सही परीक्षण

गलत टेस्ट: 6

प्रति प्रयास पास दर: 68.8%

अस्थिर टेस्ट

2

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

29.10s

प्रतिक्रिया समय (अधिकतम): 170.45s

प्रतिक्रिया समय (कुल): 290.96s

निर्देशों का पालन नहीं किया: 3 गलत उत्तर: 3

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

त्वरित तुलना

श्रेणी विवरण

श्रेणी औसत स्कोर संगति सही परीक्षण
Anti-AI Tricks 10.0 10.0
Combined 10.0 10.0
Data parsing and extraction 10.0 10.0
Domain specific 4.0 7.2
General Intelligence 6.0 10.0
Instructions following 9.0 6.8
Puzzle Solving 4.0 10.0
Tool Calling 10.0 10.0