نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

xAI: Grok 4.20 Multi-Agent Beta vs Z.ai: GLM 5 Turbo

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-15

میٹرک Grok 4.20 Multi-Agent Beta Grok 4.20 Multi-Agent Beta medium اجرا: 2026-03-12 GLM 5 Turbo GLM 5 Turbo none اجرا: 2026-03-15
درجہ #47 #53
اسکور 6.0 5.7
تسلسل 7.1 9.5
فی نتیجہ لاگت 97.178 0.467
کل لاگت $4.859 $0.028
درست ٹیسٹس
فی کوشش کامیابی کی شرح 52.1% 39.6%
غیر مستحکم ٹیسٹ 6 1
کل رنز 48 48
آؤٹ پٹ ٹوکنز 293,634 1,264
ریزننگ ٹوکنز 291,260 0
ردِعمل کا وقت (اوسط) 9.08s 2.92s
ردِعمل کا وقت (زیادہ سے زیادہ) 35.28s 8.21s
ردِعمل کا وقت (کل) 127.09s 46.72s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi-Agent Beta 5.8 4.4 66.7% 2 3.77s 28,392 27,808
GLM 5 Turbo 3.0 10.0 0.0% 0 3.01s 376 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi-Agent Beta 3.0 10.0 0.0% 0 0ms 0 0
GLM 5 Turbo 3.0 10.0 0.0% 0 4.89s 144 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi-Agent Beta 10.0 10.0 100.0% 0 5.54s 25,306 25,051
GLM 5 Turbo 10.0 10.0 100.0% 0 2.47s 204 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi-Agent Beta 2.9 7.2 11.1% 1 24.67s 164,609 163,647
GLM 5 Turbo 5.3 10.0 33.3% 0 1.97s 25 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi-Agent Beta 5.8 2.8 66.7% 1 6.40s 15,848 15,746
GLM 5 Turbo 4.2 9.9 0.0% 0 2.18s 48 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi-Agent Beta 8.3 10.0 50.0% 0 4.63s 25,457 25,322
GLM 5 Turbo 6.5 10.0 50.0% 0 2.13s 65 0
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi-Agent Beta 7.2 5.1 77.8% 2 5.01s 34,022 33,686
GLM 5 Turbo 5.5 7.4 44.4% 1 2.43s 180 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi-Agent Beta 3.0 10.0 0.0% 0 0ms 0 0
GLM 5 Turbo 10.0 10.0 100.0% 0 8.21s 222 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں