نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-Flash

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-17

میٹرک GPT-5.4 GPT-5.4 medium اجرا: 2026-03-05 Qwen3.5-Flash Qwen3.5-Flash medium اجرا: 2026-02-24
درجہ #15 #19
اسکور 8.1 8.0
تسلسل 8.6 7.6
فی نتیجہ لاگت 6.613 0.688
کل لاگت $0.794 $0.076
درست ٹیسٹس
فی کوشش کامیابی کی شرح 78.4% 82.4%
غیر مستحکم ٹیسٹ 3 5
کل رنز 51 51
آؤٹ پٹ ٹوکنز 1,780 1,827
ریزننگ ٹوکنز 46,687 179,299
ردِعمل کا وقت (اوسط) 18.95s 67.96s
ردِعمل کا وقت (زیادہ سے زیادہ) 100.41s 234.29s
ردِعمل کا وقت (کل) 322.23s 1155.28s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 383 32,992
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 483 8,270
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 235 16,237
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 58 43,615
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 99 38,486
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 98 14,139
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
Qwen3.5-Flash 6.4 4.4 77.8% 2 56.74s 162 24,276
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 309 1,284

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں