نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.7 Plus vs xAI: Grok 4.20

خلاصہ

Qwen3.7 Plus vs Grok 4.20 benchmark موازنہ: Grok 4.20 average score میں آگے ہے: 7.3 vs 7.2. Qwen3.7 Plus کی benchmark لاگت کم ہے: $0.023 vs $0.609. Qwen3.7 Plus تیز ہے: 2.85s vs 27.68s، pass rates 47.6% vs 63.5%.

تجویز کردہ ماڈل: Qwen3.7 Plus - Its score stays close to the best score here (7.2 vs 7.3), while costing about 27.6x less than Grok 4.20.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-12

میٹرک Qwen3.7 Plus Qwen3.7 Plus none اجرا: 2026-06-03 Grok 4.20 Grok 4.20 medium اجرا: 2026-03-31
اسکور 7.2 7.3
درجہ #61 #54
اعتماد پذیری 10.0 10.0
تسلسل 10.0 8.8
درست ٹیسٹس
فی کوشش کامیابی کی شرح 47.6% 63.5%
غیر مستحکم ٹیسٹ 0 3
کل رنز 63 63
فی نتیجہ لاگت 0.276 8.309
کل لاگت $0.023 $0.609
ان پٹ قیمت $0.320 / 1M $1.250 / 1M
آؤٹ پٹ قیمت $1.280 / 1M $2.500 / 1M
کل ان پٹ ٹوکنز 42,510 44,433
آؤٹ پٹ ٹوکنز 6,578 1,819
ریزننگ ٹوکنز 0 219,524
ردِعمل کا وقت (اوسط) 2.85s 27.68s
ردِعمل کا وقت (زیادہ سے زیادہ) 29.38s 199.66s
ردِعمل کا وقت (کل) 59.86s 581.26s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#61 Qwen3.7 Plus

none
Cost
$0.019
Time
213.5s
Tokens
11,960 tok

#54 xAI: Grok 4.20

medium
Cost
$0.041
Time
110.3s
Tokens
16,336 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 6.5 10.0 50.0% 0 1.38s 696 349 0
Grok 4.20 8.2 7.9 83.3% 1 3.95s 2,010 287 8,312
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 5.5 10.0 33.3% 0 2.15s 7,911 639 0
Grok 4.20 6.3 6.6 55.6% 1 109.93s 8,307 268 103,150
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 10.0 10.0 100.0% 0 29.38s 14,952 4,505 0
Grok 4.20 10.0 10.0 100.0% 0 17.40s 12,909 232 9,556
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 10.0 10.0 100.0% 0 1.43s 7,794 243 0
Grok 4.20 10.0 10.0 100.0% 0 4.17s 7,761 180 5,333
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 3.0 10.0 0.0% 0 868ms 789 18 0
Grok 4.20 5.3 10.0 33.3% 0 27.03s 1,764 375 49,339
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 5.3 10.0 0.0% 0 1.33s 522 78 0
Grok 4.20 3.9 2.6 33.3% 1 24.48s 825 65 6,440
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 6.3 10.0 50.0% 0 929ms 711 72 0
Grok 4.20 9.8 10.0 100.0% 0 4.26s 1,362 57 6,419
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 7.7 10.0 66.7% 0 1.71s 714 443 0
Grok 4.20 7.7 10.0 66.7% 0 6.22s 1,689 149 7,913
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 10.0 10.0 100.0% 0 3.54s 8,211 222 0
Grok 4.20 3.0 10.0 0.0% 0 13.68s 7,275 197 6,620
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen3.7 Plus 3.0 10.0 0.0% 0 1.21s 210 9 0
Grok 4.20 3.0 10.0 0.0% 0 63.48s 531 9 16,442

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں