نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

Grok 4.20 Multi Agent Beta vs Z.ai: GLM 5V Turbo

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-02

میٹرک Grok 4.20 Multi Agent Beta Grok 4.20 Multi Agent Beta medium اجرا: 2026-03-12 GLM 5V Turbo GLM 5V Turbo none اجرا: 2026-04-01
اسکور 6.2 6.0
درجہ #53 #55
تسلسل 7.2 10.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 54.9% 41.2%
غیر مستحکم ٹیسٹ 6 0
کل رنز 51 51
فی نتیجہ لاگت 82.962 0.588
کل لاگت $4.978 $0.042
?? ?? ???? $0.000 / 1M $1.200 / 1M
??? ?? ???? $0.000 / 1M $4.000 / 1M
آؤٹ پٹ ٹوکنز 298,948 1,388
ریزننگ ٹوکنز 296,529 0
ردِعمل کا وقت (اوسط) 8.64s 2.97s
ردِعمل کا وقت (زیادہ سے زیادہ) 35.28s 6.51s
ردِعمل کا وقت (کل) 129.64s 50.57s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi Agent Beta 6.9 5.8 75.0% 2 3.46s 33,706 33,077
GLM 5V Turbo 4.8 10.0 25.0% 0 3.13s 281 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi Agent Beta 3.0 10.0 0.0% 0 0ms 0 0
GLM 5V Turbo 3.0 10.0 0.0% 0 6.51s 276 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi Agent Beta 10.0 10.0 100.0% 0 5.54s 25,306 25,051
GLM 5V Turbo 10.0 10.0 100.0% 0 3.81s 204 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi Agent Beta 2.9 7.2 11.1% 1 24.67s 164,609 163,647
GLM 5V Turbo 5.3 10.0 33.3% 0 2.09s 24 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi Agent Beta 5.8 2.8 66.7% 1 6.40s 15,848 15,746
GLM 5V Turbo 4.6 10.0 0.0% 0 2.22s 114 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi Agent Beta 8.3 10.0 50.0% 0 4.63s 25,457 25,322
GLM 5V Turbo 6.5 10.0 50.0% 0 1.97s 60 0
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi Agent Beta 7.2 5.1 77.8% 2 5.01s 34,022 33,686
GLM 5V Turbo 5.3 10.0 33.3% 0 2.22s 207 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi Agent Beta 3.0 10.0 0.0% 0 0ms 0 0
GLM 5V Turbo 10.0 10.0 100.0% 0 4.86s 222 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں