نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

xAI: Grok 4.20 Beta vs Z.ai: GLM 5

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-12

میٹرک Grok 4.20 Beta Grok 4.20 Beta medium اجرا: 2026-03-12 GLM 5 GLM 5 none اجرا: 2026-02-12
درجہ #24 #33
اوسط اسکور 7.0 6.0
تسلسل 9.0 10.0
فی نتیجہ لاگت 5.989 0.200
کل لاگت $0.599 $0.018
درست ٹیسٹس
فی کوشش کامیابی کی شرح 70.8% 56.3%
غیر مستحکم ٹیسٹ 2 0
کل رنز 48 48
آؤٹ پٹ ٹوکنز 1,481 1,548
ریزننگ ٹوکنز 86,628 0
ردِعمل کا وقت (اوسط) 8.89s 4.03s
ردِعمل کا وقت (زیادہ سے زیادہ) 24.21s 11.07s
ردِعمل کا وقت (کل) 142.18s 36.30s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اوسط اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اوسط اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.19s 262 6,289
GLM 5 4.0 10.0 33.3% 0 3.39s 272 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
GLM 5 10.0 10.0 0.0% 0 4.98s 406 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 9.9 10.0 100.0% 0 4.01s 180 5,281
GLM 5 9.9 10.0 100.0% 0 5.78s 203 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 4.0 10.0 33.3% 0 21.33s 251 40,255
GLM 5 10.0 10.0 0.0% 0 2.24s 19 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
GLM 5 10.0 10.0 100.0% 0 3.27s 103 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 9.0 10.0 50.0% 0 4.97s 57 7,107
GLM 5 10.0 10.0 100.0% 0 1.48s 61 0
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.85s 249 6,660
GLM 5 7.0 10.0 66.7% 0 2.05s 264 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 10.0 10.0 0.0% 0 12.39s 183 5,384
GLM 5 10.0 10.0 100.0% 0 11.07s 220 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں