نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

Qwen3.6 Plus Preview vs Grok 4.20 Multi Agent Beta

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-01

میٹرک Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium اجرا: 2026-04-20 مفت دستیاب Grok 4.20 Multi Agent Beta Grok 4.20 Multi Agent Beta medium اجرا: 2026-03-12
اسکور 8.5 6.6
درجہ #15 #71
اعتماد پذیری دستیاب نہیں دستیاب نہیں
تسلسل 10.0 7.4
درست ٹیسٹس
فی کوشش کامیابی کی شرح 76.5% 63.0%
غیر مستحکم ٹیسٹ 0 6
کل رنز 49 52
فی نتیجہ لاگت 0.000 63.414
کل لاگت $0.000 $5.074
?? ?? ???? $0.000 / 1M $0.000 / 1M
??? ?? ???? $0.000 / 1M $0.000 / 1M
آؤٹ پٹ ٹوکنز 1,756 299,034
ریزننگ ٹوکنز 77,213 309,670
ردِعمل کا وقت (اوسط) 13.94s 9.80s
ردِعمل کا وقت (زیادہ سے زیادہ) 43.55s 35.28s
ردِعمل کا وقت (کل) 237.01s 156.75s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 9.90s 207 7,557
Grok 4.20 Multi Agent Beta 6.9 5.8 75.0% 2 3.46s 33,706 33,077
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 34.95s 452 13,073
Grok 4.20 Multi Agent Beta 3.0 10.0 0.0% 0 0ms 0 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 14.95s 270 10,706
Grok 4.20 Multi Agent Beta 10.0 10.0 100.0% 0 5.54s 25,306 25,051
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.6 Plus Preview 3.0 10.0 0.0% 0 22.08s 49 26,895
Grok 4.20 Multi Agent Beta 2.9 7.2 11.1% 1 24.67s 164,609 163,647
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.6 Plus Preview 5.1 10.0 0.0% 0 27.05s 111 5,232
Grok 4.20 Multi Agent Beta 5.8 2.8 66.7% 1 6.40s 15,848 15,746
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 7.54s 102 5,552
Grok 4.20 Multi Agent Beta 9.8 10.0 100.0% 0 4.63s 25,457 25,322
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 6.11s 298 6,868
Grok 4.20 Multi Agent Beta 7.2 5.1 77.8% 2 5.01s 34,022 33,686
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 5.87s 267 1,330
Grok 4.20 Multi Agent Beta 3.0 10.0 0.0% 0 0ms 0 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.6 Plus Preview - - - - - - - -
Grok 4.20 Multi Agent Beta 10.0 10.0 100.0% 0 27.11s 86 13,141

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں