AI BENCHY
तुलना करा चार्ट्स Paddhati
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#13

Step 3.5 Flash

Stepfun · प्रकाशन: 2026-02-01 · stepfun/step-3.5-flash::medium

प्रति निकाल खर्च

0.000

सुसंगतता

9.1

बरोबर चाचण्या

चुकीच्या चाचण्या: 6

प्रति प्रयत्न पास दर: 68.8%

अस्थिर चाचण्या

2

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

29.10s

प्रतिसाद वेळ (कमाल): 170.45s

प्रतिसाद वेळ (एकूण): 290.96s

सूचनांचे पालन केले नाही: 3 चुकीचे उत्तर: 3

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

झटपट तुलना

श्रेणीवार तपशील

श्रेणी सरासरी स्कोअर सुसंगतता बरोबर चाचण्या
Anti-AI Tricks 10.0 10.0
Combined 10.0 10.0
Data parsing and extraction 10.0 10.0
Domain specific 4.0 7.2
General Intelligence 6.0 10.0
Instructions following 9.0 6.8
Puzzle Solving 4.0 10.0
Tool Calling 10.0 10.0