موازنہ کریں چارٹس

زبان:

❤️ Made by XCS

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: gpt-oss-120b

ماڈل کا نام:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے : 2026-02-27 15:16

خلاصہ

میٹرک	Anthropic: Claude Sonnet 4.6 medium اجرا: ریلیز کی تاریخ نامعلوم	OpenAI: gpt-oss-120b medium اجرا: ریلیز کی تاریخ نامعلوم مفت دستیاب
درجہ	#8	#25
اسکور	7.43	5.64
تسلسل	9.40	7.55
فی نتیجہ لاگت	8.105	0.101
کل لاگت	$0.811	$0.008
درست ٹیسٹس
غلط ٹیسٹس	4	7
فی کوشش کامیابی کی شرح	73.8%	59.5%
غیر مستحکم ٹیسٹ	1	4
آؤٹ پٹ ٹوکنز	29,098	11,407
ریزننگ ٹوکنز	20,435	26,106

زمرہ وار تفصیل

اینٹی اے آئی چالیں	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6	7.00	10.00	66.7%	0		1,031	1,093
OpenAI: gpt-oss-120b	7.00	9.81	66.7%	0		3,463	2,077

ڈیٹا پارسنگ اور استخراج	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6	10.00	10.00	100.0%	0		727	907
OpenAI: gpt-oss-120b	5.50	5.87	66.7%	1		241	1,114

ڈومین مخصوص	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6	1.00	7.21	11.1%	1		25,790	16,919
OpenAI: gpt-oss-120b	1.00	4.41	22.2%	2		6,018	18,520

ہدایات کی پیروی	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6	10.00	10.00	100.0%	0		316	523
OpenAI: gpt-oss-120b	10.00	10.00	100.0%	0		120	1,770

Puzzle Solving	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6	10.00	10.00	100.0%	0		579	642
OpenAI: gpt-oss-120b	5.00	7.13	44.4%	1		1,278	1,542

ٹول کالنگ	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6	10.00	10.00	100.0%	0		655	351
OpenAI: gpt-oss-120b	9.00	9.97	100.0%	0		287	1,083

موازنہ کی جوڑی تبدیل کریں

Anthropic: Claude Sonnet 4.6 کا موازنہ اس کے ساتھ کریں...

OpenAI: gpt-oss-120b کا موازنہ اس کے ساتھ کریں...