نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

Qwen: Qwen3.5-27B vs xAI: Grok 4.3

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-01

میٹرک Qwen3.5-27B Qwen3.5-27B medium اجرا: 2026-02-24 Grok 4.3 Grok 4.3 medium اجرا: 2026-05-01
اسکور 8.4 8.2
درجہ #16 #20
اعتماد پذیری دستیاب نہیں 10.0
تسلسل 8.8 8.6
درست ٹیسٹس
فی کوشش کامیابی کی شرح 81.5% 81.5%
غیر مستحکم ٹیسٹ 3 3
کل رنز 54 54
فی نتیجہ لاگت 3.822 3.974
کل لاگت $0.497 $0.517
?? ?? ???? $0.195 / 1M $1.250 / 1M
??? ?? ???? $1.560 / 1M $2.500 / 1M
آؤٹ پٹ ٹوکنز 2,500 1,223
ریزننگ ٹوکنز 242,500 187,047
ردِعمل کا وقت (اوسط) 53.03s 48.63s
ردِعمل کا وقت (زیادہ سے زیادہ) 163.96s 216.69s
ردِعمل کا وقت (کل) 954.46s 875.27s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.5-27B 8.7 7.9 91.7% 1 19.75s 569 31,505
Grok 4.3 10.0 10.0 100.0% 0 8.83s 88 8,207
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.5-27B 10.0 10.0 100.0% 0 70.35s 375 19,165
Grok 4.3 10.0 10.0 100.0% 0 45.72s 284 9,659
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.5-27B 10.0 10.0 100.0% 0 163.96s 483 9,991
Grok 4.3 10.0 10.0 100.0% 0 63.99s 234 15,301
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.5-27B 10.0 10.0 100.0% 0 30.26s 270 16,150
Grok 4.3 10.0 10.0 100.0% 0 18.97s 180 9,546
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.5-27B 5.3 10.0 33.3% 0 79.53s 43 52,368
Grok 4.3 5.3 7.2 44.4% 1 181.74s 14 111,300
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.5-27B 6.1 3.1 66.7% 1 101.41s 70 23,147
Grok 4.3 5.4 2.5 66.7% 1 24.70s 70 5,020
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.5-27B 10.0 10.0 100.0% 0 19.66s 97 11,638
Grok 4.3 9.8 10.0 100.0% 0 18.58s 57 8,713
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.5-27B 8.2 7.7 77.8% 1 64.61s 245 77,213
Grok 4.3 5.9 7.2 55.6% 1 22.53s 128 14,686
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.5-27B 10.0 10.0 100.0% 0 7.45s 348 1,323
Grok 4.3 10.0 10.0 100.0% 0 17.66s 168 4,615

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں