نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: gpt-oss-120b vs Qwen: Qwen3.6 Flash

خلاصہ

gpt-oss-120b vs Qwen3.6 Flash benchmark موازنہ: gpt-oss-120b average score میں آگے ہے: 6.1 vs 5.4. gpt-oss-120b کی benchmark لاگت کم ہے: $0.013 vs $0.015. Qwen3.6 Flash تیز ہے: 1.60s vs 22.28s، pass rates 52.4% vs 33.3%.

تجویز کردہ ماڈل: Qwen3.6 Flash - Its score stays close to the best score here (5.4 vs 6.1), while responding about 13.9x faster than gpt-oss-120b.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-10

میٹرک gpt-oss-120b gpt-oss-120b medium اجرا: 2025-08-05 مفت دستیاب Qwen3.6 Flash Qwen3.6 Flash none اجرا: 2026-04-20
اسکور 6.1 5.4
درجہ #100 #129
اعتماد پذیری 10.0 10.0
تسلسل 8.0 10.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 52.4% 33.3%
غیر مستحکم ٹیسٹ 5 0
کل رنز 63 63
فی نتیجہ لاگت 0.141 0.266
کل لاگت $0.013 $0.015
ان پٹ قیمت $0.039 / 1M $0.188 / 1M
آؤٹ پٹ قیمت $0.180 / 1M $1.125 / 1M
کل ان پٹ ٹوکنز 39,084 50,810
آؤٹ پٹ ٹوکنز 20,013 4,164
ریزننگ ٹوکنز 50,233 0
ردِعمل کا وقت (اوسط) 22.28s 1.60s
ردِعمل کا وقت (زیادہ سے زیادہ) 68.16s 4.60s
ردِعمل کا وقت (کل) 311.96s 33.59s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#100 gpt-oss-120b

medium
Cost
$0.001
Time
26.7s
Tokens
555 tok

#129 Qwen3.6 Flash

none
Cost
$0.005
Time
20.1s
Tokens
4,211 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 1,314 3,518 2,177
Qwen3.6 Flash 3.1 10.0 0.0% 0 1.63s 696 1,554 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 5.9 7.0 55.6% 1 38.37s 7,782 3,365 11,973
Qwen3.6 Flash 5.4 10.0 33.3% 0 1.79s 6,488 889 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 11,535 694 5,072
Qwen3.6 Flash 3.0 10.0 0.0% 0 4.22s 24,675 315 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 7,476 241 1,114
Qwen3.6 Flash 10.0 10.0 100.0% 0 2.13s 7,794 243 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 1,266 6,784 20,606
Qwen3.6 Flash 5.3 10.0 33.3% 0 1.11s 789 15 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 659 107 387
Qwen3.6 Flash 10.0 10.0 100.0% 0 947ms 522 132 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 1,036 126 1,799
Qwen3.6 Flash 6.3 10.0 50.0% 0 1.10s 711 66 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,190 1,790 2,264
Qwen3.6 Flash 3.5 10.0 0.0% 0 1.21s 714 669 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 6,514 287 1,083
Qwen3.6 Flash 10.0 10.0 100.0% 0 2.49s 8,211 272 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 312 3,101 3,758
Qwen3.6 Flash 3.0 10.0 0.0% 0 649ms 210 9 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں