نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

xAI: Grok 4.20 Beta vs Z.ai: GLM 4.7 Flash

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-12

میٹرک Grok 4.20 Beta Grok 4.20 Beta none اجرا: 2026-03-12 GLM 4.7 Flash GLM 4.7 Flash medium اجرا: 2026-01-19
درجہ #52 #62
اوسط اسکور 4.4 3.1
تسلسل 9.1 6.4
فی نتیجہ لاگت 2.214 1.040
کل لاگت $0.089 $0.042
درست ٹیسٹس
فی کوشش کامیابی کی شرح 33.3% 41.7%
غیر مستحکم ٹیسٹ 2 7
کل رنز 48 48
آؤٹ پٹ ٹوکنز 1,511 38,682
ریزننگ ٹوکنز 0 64,952
ردِعمل کا وقت (اوسط) 1.22s 36.84s
ردِعمل کا وقت (زیادہ سے زیادہ) 6.48s 174.55s
ردِعمل کا وقت (کل) 19.53s 331.58s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اوسط اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اوسط اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 3.3 7.9 22.2% 1 562ms 245 0
GLM 4.7 Flash 4.0 4.5 55.6% 2 27.09s 1,085 5,597
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 10.0 10.0 0.0% 0 6.48s 282 0
GLM 4.7 Flash 10.0 2.1 33.3% 1 65.57s 2,585 20,648
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 9.9 10.0 100.0% 0 601ms 197 0
GLM 4.7 Flash 5.0 10.0 50.0% 0 1.51s 584 2,755
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 10.0 10.0 0.0% 0 611ms 160 0
GLM 4.7 Flash 10.0 4.4 33.3% 2 174.55s 33,000 25,394
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 5.0 10.0 0.0% 0 541ms 87 0
GLM 4.7 Flash 10.0 9.7 0.0% 0 18.14s 18 2,138
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 4.5 10.0 0.0% 0 687ms 60 0
GLM 4.7 Flash 5.0 5.8 66.7% 1 2.97s 388 2,181
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 4.0 7.2 55.6% 1 541ms 291 0
GLM 4.7 Flash 10.0 7.2 11.1% 1 12.90s 798 5,225
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.79s 189 0
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 224 1,014

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں