نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: gpt-oss-120b vs Qwen: Qwen3.5 Plus 2026-02-15

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-29

میٹرک gpt-oss-120b gpt-oss-120b medium اجرا: 2025-08-05 مفت دستیاب Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none اجرا: 2026-02-15
اسکور 5.9 6.4
درجہ #103 #94
اعتماد پذیری 10.0 10.0
تسلسل 7.9 9.3
درست ٹیسٹس
فی کوشش کامیابی کی شرح 50.0% 48.3%
غیر مستحکم ٹیسٹ 5 2
کل رنز 60 60
فی نتیجہ لاگت 0.151 0.195
کل لاگت $0.013 $0.018
ان پٹ قیمت $0.039 / 1M $0.260 / 1M
آؤٹ پٹ قیمت $0.180 / 1M $1.560 / 1M
آؤٹ پٹ ٹوکنز 17,495 2,474
ریزننگ ٹوکنز 46,878 0
ردِعمل کا وقت (اوسط) 22.41s 2.40s
ردِعمل کا وقت (زیادہ سے زیادہ) 68.16s 6.65s
ردِعمل کا وقت (کل) 291.35s 33.56s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
Qwen3.5 Plus 2026-02-15 4.8 10.0 25.0% 0 1.91s 517 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 3.9 5.6 33.3% 1 47.24s 847 8,618
Qwen3.5 Plus 2026-02-15 4.9 6.9 16.7% 1 2.54s 467 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 6.65s 314 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.89s 243 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 1.17s 17 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
Qwen3.5 Plus 2026-02-15 4.4 3.0 33.3% 1 2.26s 117 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.67s 72 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,790 2,264
Qwen3.5 Plus 2026-02-15 7.7 10.0 66.7% 0 2.71s 494 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 3.33s 222 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 3,101 3,758
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 1.11s 11 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں