AI BENCHY
موازنہ کریں چارٹس طریقہ کار
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#13

Step 3.5 Flash

Stepfun · اجرا: 2026-02-01 · stepfun/step-3.5-flash::medium

فی نتیجہ لاگت

0.000

تسلسل

9.1

کل لاگت

$0.000

درست ٹیسٹس

غلط ٹیسٹس: 6

فی کوشش کامیابی کی شرح: 68.8%

غیر مستحکم ٹیسٹ

2

غیر مستحکم ٹیسٹس میں رنز کے درمیان ملے جلے نتائج آئے (کم از کم ایک کامیاب اور ایک ناکام).

ردِعمل کا وقت (اوسط)

29.10s

ردِعمل کا وقت (زیادہ سے زیادہ): 170.45s

ردِعمل کا وقت (کل): 290.96s

ہدایات پر عمل نہیں کیا: 3 غلط جواب: 3

چارٹس

پہلا ماڈل منتخب کریں، پھر دوسرا ماڈل کلک کریں تاکہ سائیڈ بائی سائیڈ صفحہ کھلے۔

فوری موازنہ

زمرہ وار تفصیل

زمرہ اوسط اسکور تسلسل درست ٹیسٹس
Anti-AI Tricks 10.0 10.0
Combined 10.0 10.0
Data parsing and extraction 10.0 10.0
Domain specific 4.0 7.2
General Intelligence 6.0 10.0
Instructions following 9.0 6.8
Puzzle Solving 4.0 10.0
Tool Calling 10.0 10.0