نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

StepFun: Step 3.5 Flash vs Z.ai: GLM 5

خلاصہ

Step 3.5 Flash vs GLM 5 benchmark موازنہ: Step 3.5 Flash average score میں آگے ہے: 6.6 vs 6.0. GLM 5 کی benchmark لاگت کم ہے: $0.027 vs $0.070. GLM 5 تیز ہے: 4.03s vs 72.53s، pass rates 54.0% vs 44.4%.

تجویز کردہ ماڈل: GLM 5 - Its score stays close to the best score here (6.0 vs 6.6), while costing about 2.6x less than Step 3.5 Flash.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-18

میٹرک Step 3.5 Flash Step 3.5 Flash medium اجرا: 2026-02-01 GLM 5 GLM 5 none اجرا: 2026-02-12
اسکور 6.6 6.0
درجہ #80 #101
اعتماد پذیری 10.0 10.0
تسلسل 8.9 9.7
درست ٹیسٹس
فی کوشش کامیابی کی شرح 54.0% 44.4%
غیر مستحکم ٹیسٹ 1 1
کل رنز 60 63
فی نتیجہ لاگت 0.198 0.263
کل لاگت $0.070 $0.027
ان پٹ قیمت $0.090 / 1M $0.600 / 1M
آؤٹ پٹ قیمت $0.300 / 1M $1.920 / 1M
کل ان پٹ ٹوکنز 34,431 37,135
آؤٹ پٹ ٹوکنز 91,587 1,989
ریزننگ ٹوکنز 195,973 0
ردِعمل کا وقت (اوسط) 72.53s 4.03s
ردِعمل کا وقت (زیادہ سے زیادہ) 453.94s 11.07s
ردِعمل کا وقت (کل) 1015.47s 56.37s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#80 Step 3.5 Flash

medium
لاگت
$0.008
وقت
277.1s
ٹوکنز
23,695 tok

#101 GLM 5

none
لاگت
$0.007
وقت
32.1s
ٹوکنز
2,023 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Step 3.5 Flash 10.0 10.0 100.0% 0 40.57s 694 20,391 24,176
GLM 5 4.8 10.0 25.0% 0 2.37s 510 275 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Step 3.5 Flash 2.4 5.2 0.0% 0 258.38s 2,211 13,207 22,429
GLM 5 4.0 7.8 11.1% 1 5.12s 7,256 428 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 13,638 1,176 12,984
GLM 5 3.0 10.0 0.0% 0 4.98s 12,812 406 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 7,368 600 13,886
GLM 5 10.0 10.0 100.0% 0 5.78s 7,107 203 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 673 45,350 90,436
GLM 5 3.0 10.0 0.0% 0 2.24s 643 19 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Step 3.5 Flash 5.5 10.0 0.0% 0 22.39s 509 240 3,506
GLM 5 10.0 10.0 100.0% 0 3.27s 477 103 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Step 3.5 Flash 8.3 10.0 50.0% 0 4.78s 705 2,364 3,521
GLM 5 10.0 10.0 100.0% 0 1.48s 636 61 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Step 3.5 Flash 5.3 10.0 33.3% 0 7.22s 711 5,630 10,861
GLM 5 7.7 10.0 66.7% 0 1.91s 609 261 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 7,701 275 3,802
GLM 5 10.0 10.0 100.0% 0 11.07s 6,899 220 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Step 3.5 Flash 3.0 10.0 0.0% 0 108.45s 221 2,354 10,372
GLM 5 3.0 10.0 0.0% 0 3.62s 186 13 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں