موازنہ کریں چارٹس

زبان:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-5.3-Codex vs Qwen: Qwen3.5-27B

ماڈل کا نام:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے : 2026-02-27 15:16

خلاصہ

میٹرک	OpenAI: GPT-5.3-Codex medium اجرا: ریلیز کی تاریخ نامعلوم	Qwen: Qwen3.5-27B medium اجرا: ریلیز کی تاریخ نامعلوم
درجہ	#7	#5
اسکور	7.93	8.55
تسلسل	8.84	9.55
فی نتیجہ لاگت	4.641	2.950
کل لاگت	$0.465	$0.325
درست ٹیسٹس
غلط ٹیسٹس	4	3
فی کوشش کامیابی کی شرح	78.6%	83.3%
غیر مستحکم ٹیسٹ	2	1
آؤٹ پٹ ٹوکنز	1,201	1,091
ریزننگ ٹوکنز	30,056	131,807

زمرہ وار تفصیل

اینٹی اے آئی چالیں	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: GPT-5.3-Codex	10.00	10.00	100.0%	0		216	1,421
Qwen: Qwen3.5-27B	10.00	10.00	100.0%	0		102	8,956

ڈیٹا پارسنگ اور استخراج	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: GPT-5.3-Codex	10.00	10.00	100.0%	0		234	735
Qwen: Qwen3.5-27B	9.88	10.00	100.0%	0		270	16,150

ڈومین مخصوص	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: GPT-5.3-Codex	4.00	7.21	55.6%	1		64	25,308
Qwen: Qwen3.5-27B	4.00	10.00	33.3%	0		43	52,368

ہدایات کی پیروی	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: GPT-5.3-Codex	9.00	10.00	50.0%	0		93	693
Qwen: Qwen3.5-27B	9.00	6.88	83.3%	1		97	11,638

Puzzle Solving	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: GPT-5.3-Codex	7.00	7.38	77.8%	1		340	1,407
Qwen: Qwen3.5-27B	10.00	10.00	100.0%	0		231	41,372

ٹول کالنگ	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: GPT-5.3-Codex	10.00	10.00	100.0%	0		254	492
Qwen: Qwen3.5-27B	10.00	10.00	100.0%	0		348	1,323

موازنہ کی جوڑی تبدیل کریں

OpenAI: GPT-5.3-Codex کا موازنہ اس کے ساتھ کریں...

Qwen: Qwen3.5-27B کا موازنہ اس کے ساتھ کریں...