نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

HY3 Preview vs Grok 4.20 Multi Agent Beta

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-26

میٹرک HY3 Preview HY3 Preview high اجرا: 2026-04-22 مفت دستیاب Grok 4.20 Multi Agent Beta Grok 4.20 Multi Agent Beta medium اجرا: 2026-03-12
اسکور 8.5 6.4
درجہ #11 #67
اعتماد پذیری دستیاب نہیں دستیاب نہیں
تسلسل 8.8 7.4
درست ٹیسٹس
فی کوشش کامیابی کی شرح 81.5% 57.4%
غیر مستحکم ٹیسٹ 3 6
کل رنز 50 52
فی نتیجہ لاگت 0.000 72.473
کل لاگت $0.000 $5.074
?? ?? ???? $0.000 / 1M $0.000 / 1M
??? ?? ???? $0.000 / 1M $0.000 / 1M
آؤٹ پٹ ٹوکنز 238,920 299,034
ریزننگ ٹوکنز 0 309,670
ردِعمل کا وقت (اوسط) 55.19s 9.80s
ردِعمل کا وقت (زیادہ سے زیادہ) 149.94s 35.28s
ردِعمل کا وقت (کل) 938.23s 156.75s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
HY3 Preview 10.0 10.0 100.0% 0 32.69s 26,550 0
Grok 4.20 Multi Agent Beta 6.9 5.8 75.0% 2 3.46s 33,706 33,077
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
HY3 Preview 10.0 10.0 100.0% 0 99.76s 38,167 0
Grok 4.20 Multi Agent Beta 10.0 10.0 100.0% 0 27.11s 86 13,141
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
HY3 Preview 10.0 10.0 100.0% 0 113.09s 31,319 0
Grok 4.20 Multi Agent Beta 3.0 10.0 0.0% 0 0ms 0 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
HY3 Preview 6.5 10.0 50.0% 0 12.11s 4,323 0
Grok 4.20 Multi Agent Beta 10.0 10.0 100.0% 0 5.54s 25,306 25,051
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
HY3 Preview 5.3 7.2 44.4% 1 109.04s 87,559 0
Grok 4.20 Multi Agent Beta 2.9 7.2 11.1% 1 24.67s 164,609 163,647
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
HY3 Preview 10.0 10.0 100.0% 0 24.31s 5,490 0
Grok 4.20 Multi Agent Beta 5.8 2.8 66.7% 1 6.40s 15,848 15,746
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
HY3 Preview 8.5 6.8 83.3% 1 34.02s 13,331 0
Grok 4.20 Multi Agent Beta 8.3 10.0 50.0% 0 4.63s 25,457 25,322
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
HY3 Preview 9.0 7.9 88.9% 1 28.07s 21,811 0
Grok 4.20 Multi Agent Beta 7.2 5.1 77.8% 2 5.01s 34,022 33,686
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
HY3 Preview 10.0 10.0 100.0% 0 78.83s 10,370 0
Grok 4.20 Multi Agent Beta 3.0 10.0 0.0% 0 0ms 0 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں