موازنہ کریں چارٹس

زبان:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: gpt-oss-120b vs Qwen: Qwen3.5-27B

ماڈل کا نام:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے : 2026-02-27 15:16

خلاصہ

میٹرک	OpenAI: gpt-oss-120b medium اجرا: ریلیز کی تاریخ نامعلوم مفت دستیاب	Qwen: Qwen3.5-27B medium اجرا: ریلیز کی تاریخ نامعلوم
درجہ	#25	#5
اسکور	5.64	8.55
تسلسل	7.55	9.55
فی نتیجہ لاگت	0.101	2.950
کل لاگت	$0.008	$0.325
درست ٹیسٹس
غلط ٹیسٹس	7	3
فی کوشش کامیابی کی شرح	59.5%	83.3%
غیر مستحکم ٹیسٹ	4	1
آؤٹ پٹ ٹوکنز	11,407	1,091
ریزننگ ٹوکنز	26,106	131,807

زمرہ وار تفصیل

اینٹی اے آئی چالیں	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: gpt-oss-120b	7.00	9.81	66.7%	0		3,463	2,077
Qwen: Qwen3.5-27B	10.00	10.00	100.0%	0		102	8,956

ڈیٹا پارسنگ اور استخراج	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: gpt-oss-120b	5.50	5.87	66.7%	1		241	1,114
Qwen: Qwen3.5-27B	9.88	10.00	100.0%	0		270	16,150

ڈومین مخصوص	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: gpt-oss-120b	1.00	4.41	22.2%	2		6,018	18,520
Qwen: Qwen3.5-27B	4.00	10.00	33.3%	0		43	52,368

ہدایات کی پیروی	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: gpt-oss-120b	10.00	10.00	100.0%	0		120	1,770
Qwen: Qwen3.5-27B	9.00	6.88	83.3%	1		97	11,638

Puzzle Solving	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: gpt-oss-120b	5.00	7.13	44.4%	1		1,278	1,542
Qwen: Qwen3.5-27B	10.00	10.00	100.0%	0		231	41,372

ٹول کالنگ	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: gpt-oss-120b	9.00	9.97	100.0%	0		287	1,083
Qwen: Qwen3.5-27B	10.00	10.00	100.0%	0		348	1,323

موازنہ کی جوڑی تبدیل کریں

OpenAI: gpt-oss-120b کا موازنہ اس کے ساتھ کریں...

Qwen: Qwen3.5-27B کا موازنہ اس کے ساتھ کریں...