موازنہ کریں چارٹس

زبان:

❤️ Made by XCS

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Qwen: Qwen3.5-122B-A10B

ماڈل کا نام:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے : 2026-02-27 15:16

خلاصہ

میٹرک	Anthropic: Claude Opus 4.6 medium اجرا: ریلیز کی تاریخ نامعلوم	Qwen: Qwen3.5-122B-A10B medium اجرا: ریلیز کی تاریخ نامعلوم
درجہ	#20	#13
اسکور	6.07	6.77
تسلسل	8.80	8.22
فی نتیجہ لاگت	10.992	5.137
کل لاگت	$0.880	$0.463
درست ٹیسٹس
غلط ٹیسٹس	6	5
فی کوشش کامیابی کی شرح	61.9%	76.2%
غیر مستحکم ٹیسٹ	2	3
آؤٹ پٹ ٹوکنز	19,576	16,751
ریزننگ ٹوکنز	11,081	125,394

زمرہ وار تفصیل

اینٹی اے آئی چالیں	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6	4.00	4.41	55.6%	2		897	1,000
Qwen: Qwen3.5-122B-A10B	10.00	10.00	100.0%	0		248	10,486

ڈیٹا پارسنگ اور استخراج	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6	10.00	10.00	100.0%	0		668	763
Qwen: Qwen3.5-122B-A10B	9.88	10.00	100.0%	0		270	16,558

ڈومین مخصوص	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6	1.00	10.00	0.0%	0		16,328	7,928
Qwen: Qwen3.5-122B-A10B	1.00	7.21	11.1%	1		15,537	64,889

ہدایات کی پیروی	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6	9.50	9.99	100.0%	0		266	468
Qwen: Qwen3.5-122B-A10B	5.50	5.92	83.3%	1		77	7,372

Puzzle Solving	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6	7.00	10.00	66.7%	0		556	593
Qwen: Qwen3.5-122B-A10B	7.00	7.21	88.9%	1		297	24,863

ٹول کالنگ	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6	10.00	10.00	100.0%	0		861	329
Qwen: Qwen3.5-122B-A10B	10.00	10.00	100.0%	0		322	1,226

موازنہ کی جوڑی تبدیل کریں

Anthropic: Claude Opus 4.6 کا موازنہ اس کے ساتھ کریں...

Qwen: Qwen3.5-122B-A10B کا موازنہ اس کے ساتھ کریں...