موازنہ کریں چارٹس

زبان:

❤️ Made by XCS

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs OpenAI: gpt-oss-120b

ماڈل کا نام:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے : 2026-02-27 15:16

خلاصہ

میٹرک	Anthropic: Claude Opus 4.6 medium اجرا: ریلیز کی تاریخ نامعلوم	OpenAI: gpt-oss-120b medium اجرا: ریلیز کی تاریخ نامعلوم مفت دستیاب
درجہ	#20	#25
اسکور	6.07	5.64
تسلسل	8.80	7.55
فی نتیجہ لاگت	10.992	0.101
کل لاگت	$0.880	$0.008
درست ٹیسٹس
غلط ٹیسٹس	6	7
فی کوشش کامیابی کی شرح	61.9%	59.5%
غیر مستحکم ٹیسٹ	2	4
آؤٹ پٹ ٹوکنز	19,576	11,407
ریزننگ ٹوکنز	11,081	26,106

زمرہ وار تفصیل

اینٹی اے آئی چالیں	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6	4.00	4.41	55.6%	2		897	1,000
OpenAI: gpt-oss-120b	7.00	9.81	66.7%	0		3,463	2,077

ڈیٹا پارسنگ اور استخراج	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6	10.00	10.00	100.0%	0		668	763
OpenAI: gpt-oss-120b	5.50	5.87	66.7%	1		241	1,114

ڈومین مخصوص	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6	1.00	10.00	0.0%	0		16,328	7,928
OpenAI: gpt-oss-120b	1.00	4.41	22.2%	2		6,018	18,520

ہدایات کی پیروی	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6	9.50	9.99	100.0%	0		266	468
OpenAI: gpt-oss-120b	10.00	10.00	100.0%	0		120	1,770

Puzzle Solving	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6	7.00	10.00	66.7%	0		556	593
OpenAI: gpt-oss-120b	5.00	7.13	44.4%	1		1,278	1,542

ٹول کالنگ	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6	10.00	10.00	100.0%	0		861	329
OpenAI: gpt-oss-120b	9.00	9.97	100.0%	0		287	1,083

موازنہ کی جوڑی تبدیل کریں

Anthropic: Claude Opus 4.6 کا موازنہ اس کے ساتھ کریں...

OpenAI: gpt-oss-120b کا موازنہ اس کے ساتھ کریں...