موازنہ کریں چارٹس

زبان:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-27B

موازنہ کریں:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-05

میٹرک	OpenAI: GPT-5.4 none اجرا: 2026-03-05	Qwen: Qwen3.5-27B none اجرا: 2026-02-24
درجہ	#44	#41
اوسط اسکور	4.6	4.9
درست ٹیسٹس
تسلسل	8.9	9.0
فی نتیجہ لاگت	1.496	0.297
کل لاگت	$0.090	$0.015
فی کوشش کامیابی کی شرح	44.4%	40.0%
غیر مستحکم ٹیسٹ	2	2
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
آؤٹ پٹ ٹوکنز	1,635	3,035
ریزننگ ٹوکنز	0	0
ردِعمل کا وقت (اوسط)	1.46s	1.70s
ردِعمل کا وقت (زیادہ سے زیادہ)	2.89s	9.39s
ردِعمل کا وقت (کل)	21.86s	25.55s

اسکور کے لحاظ سے سرفہرست ماڈلز

ردِعمل کا وقت (اوسط)

اسکور بمقابلہ کل لاگت

اوسط اسکور vs ردِعمل کا وقت (اوسط)

زمرہ وار تفصیل

اینٹی اے آئی چالیں	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	ردِعمل کا وقت (اوسط)	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0
Qwen: Qwen3.5-27B	4.0	10.0	33.3%	0		796ms	264	0

مشترکہ	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	ردِعمل کا وقت (اوسط)	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0
Qwen: Qwen3.5-27B	10.0	1.6	33.3%	1		9.39s	1,461	0

ڈیٹا پارسنگ اور استخراج	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	ردِعمل کا وقت (اوسط)	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0
Qwen: Qwen3.5-27B	9.9	10.0	100.0%	0		1.43s	243	0

ڈومین مخصوص	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	ردِعمل کا وقت (اوسط)	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0
Qwen: Qwen3.5-27B	10.0	10.0	0.0%	0		540ms	15	0

ہدایات کی پیروی	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	ردِعمل کا وقت (اوسط)	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0
Qwen: Qwen3.5-27B	4.5	10.0	0.0%	0		815ms	69	0

Puzzle Solving	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	ردِعمل کا وقت (اوسط)	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0
Qwen: Qwen3.5-27B	6.3	7.9	55.6%	1		1.37s	680	0

ٹول کالنگ	اسکور	تسلسل	فی کوشش کامیابی کی شرح	غیر مستحکم ٹیسٹ	درست ٹیسٹس	ردِعمل کا وقت (اوسط)	آؤٹ پٹ ٹوکنز	ریزننگ ٹوکنز
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0
Qwen: Qwen3.5-27B	10.0	10.0	100.0%	0		3.54s	303	0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں

MiniMax M2.5mediumvsQwen3.5-27Bnone MiniMax M2.5mediumvsGPT-5.4none gpt-oss-120bmediumمفت دستیابvsQwen3.5-27Bnone Mercury 2mediumvsQwen3.5-27Bnone GPT-5 NanomediumvsQwen3.5-27Bnone Mercury 2mediumvsGPT-5.4none GPT-5 MinimediumvsQwen3.5-27Bnone GPT-5.4nonevsQwen3.5-35B-A3Bmedium GPT-5.4nonevsQwen3 Coder Nextmedium GPT-5.4nonevsGLM 4.7 Flashmedium Claude Opus 4.6mediumvsQwen3.5-27Bnone Kimi K2.5mediumvsQwen3.5-27Bnone