نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: gpt-oss-120b vs Qwen: Qwen3.5-Flash

ماڈل کا نام:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے : 2026-02-27 15:16

خلاصہ

میٹرک OpenAI: gpt-oss-120b medium اجرا: ریلیز کی تاریخ نامعلوم مفت دستیاب Qwen: Qwen3.5-Flash medium اجرا: ریلیز کی تاریخ نامعلوم
درجہ #25 #24
اسکور 5.64 5.79
تسلسل 7.55 7.60
فی نتیجہ لاگت 0.101 0.650
کل لاگت $0.008 $0.046
درست ٹیسٹس
غلط ٹیسٹس 7 7
فی کوشش کامیابی کی شرح 59.5% 66.7%
غیر مستحکم ٹیسٹ 4 4
آؤٹ پٹ ٹوکنز 11,407 1,194
ریزننگ ٹوکنز 26,106 108,368

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: gpt-oss-120b 7.00 9.81 66.7% 0 3,463 2,077
Qwen: Qwen3.5-Flash 10.00 10.00 100.0% 0 363 23,645
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: gpt-oss-120b 5.50 5.87 66.7% 1 241 1,114
Qwen: Qwen3.5-Flash 5.50 5.87 83.3% 1 235 16,237
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: gpt-oss-120b 1.00 4.41 22.2% 2 6,018 18,520
Qwen: Qwen3.5-Flash 1.00 4.41 33.3% 2 52 34,605
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: gpt-oss-120b 10.00 10.00 100.0% 0 120 1,770
Qwen: Qwen3.5-Flash 7.50 9.91 50.0% 0 98 14,139
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: gpt-oss-120b 5.00 7.13 44.4% 1 1,278 1,542
Qwen: Qwen3.5-Flash 4.00 7.21 55.6% 1 137 18,458
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: gpt-oss-120b 9.00 9.97 100.0% 0 287 1,083
Qwen: Qwen3.5-Flash 10.00 10.00 100.0% 0 309 1,284

موازنہ کی جوڑی تبدیل کریں