GPT-5.4 Mini (medium) vs Qwen3.5-27B (medium)

रैंक: #69
कुल आउटपुट टोकन: 151,755
प्रतिक्रिया समय (औसत): 25.94s
कुल लागत: $0.756

रैंक: #71
कुल आउटपुट टोकन: 614,429
प्रतिक्रिया समय (औसत): 111.94s
कुल लागत: $0.981

अनुशंसित मॉडल GPT-5.4 Mini (medium)

It has the best score here (7.5), while responding about 4.3x faster than Qwen3.5-27B (medium).

विस्तृत तुलना

मेट्रिक	GPT-5.4 Mini GPT-5.4 Mini medium रिलीज़: 2026-03-17	Qwen3.5-27B Qwen3.5-27B medium रिलीज़: 2026-02-24

मेट्रिक	GPT-5.4 Mini GPT-5.4 Mini medium रिलीज़: 2026-03-17	Qwen3.5-27B Qwen3.5-27B medium रिलीज़: 2026-02-24
स्कोर	7.5	7.4
रैंक	#69	#71
विश्वसनीयता	10.0	10.0
संगति	7.7	8.2
सही परीक्षण
प्रति प्रयास पास दर	71.2%	72.7%
अस्थिर टेस्ट	6	5
कुल रन	66	66
प्रति परिणाम लागत	6.299	8.324
कुल लागत	$0.756	$0.981
इनपुट कीमत	$0.750 / 1M	$0.195 / 1M
आउटपुट कीमत	$4.500 / 1M	$1.560 / 1M
कुल इनपुट टोकन	97,155	111,635
आउटपुट टोकन	6,211	15,999
रीजनिंग टोकन	145,544	598,430
प्रतिक्रिया समय (औसत)	25.94s	111.94s
प्रतिक्रिया समय (अधिकतम)	138.75s	1026.43s
प्रतिक्रिया समय (कुल)	570.66s	2462.67s

मॉडल जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#69 GPT-5.4 Mini

medium

लागत: $0.056
समय: 95.5s
टोकन: 12,464 tok

#71 Qwen3.5-27B

medium

लागत: $0.008
समय: 62.0s
टोकन: 3,099 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

श्रेणी:

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4 Mini	8.6	7.9	91.7%	1		4.05s	606	296	2,876
Qwen3.5-27B	8.7	7.9	91.7%	1		19.75s	672	569	31,505

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4 Mini	8.4	7.4	88.9%	1		57.87s	7,305	467	40,902
Qwen3.5-27B	6.2	7.1	55.6%	1		160.69s	7,895	6,381	89,388

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4 Mini	6.9	5.9	66.7%	1		59.64s	74,058	4,347	40,924
Qwen3.5-27B	7.3	5.8	83.3%	1		595.19s	84,417	7,948	279,132

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4 Mini	10.0	10.0	100.0%	0		2.43s	7,140	234	650
Qwen3.5-27B	10.0	10.0	100.0%	0		30.26s	7,782	270	16,150

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4 Mini	4.1	4.4	44.5%	2		65.31s	619	60	43,286
Qwen3.5-27B	5.3	10.0	33.3%	0		79.53s	553	43	52,368

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4 Mini	4.5	10.0	0.0%	0		3.72s	477	150	510
Qwen3.5-27B	6.1	3.1	66.7%	1		101.41s	524	70	23,147

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4 Mini	9.8	10.0	100.0%	0		2.13s	660	96	1,185
Qwen3.5-27B	10.0	10.0	100.0%	0		19.66s	699	97	11,638

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4 Mini	7.8	10.0	66.7%	0		4.37s	642	278	2,443
Qwen3.5-27B	8.2	7.7	77.8%	1		59.60s	696	242	70,096

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4 Mini	4.7	1.6	66.7%	1		9.62s	5,453	251	2,594
Qwen3.5-27B	10.0	10.0	100.0%	0		7.45s	8,193	348	1,323

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.4 Mini	3.0	10.0	0.0%	0		30.10s	195	32	10,174
Qwen3.5-27B	3.0	10.0	0.0%	0		85.11s	204	31	23,683

त्वरित तुलना

तुलना जोड़ी बदलें

GPT-5.6 TerralowvsQwen3.5-27Bmedium GPT-5.4 MinimediumvsQwen3.7 Maxnone Claude Opus 5nonevsGPT-5.4 Minimedium GPT-5.3 ChatnonevsQwen3.5-27Bmedium Gemini 3 Flash PreviewlowvsQwen3.5-27Bmedium KAT-Coder-Pro V2.5lowvsQwen3.5-27Bmedium Claude Sonnet 4.6nonevsQwen3.5-27Bmedium Claude Opus 5nonevsQwen3.5-27Bmedium Gemini 3 Flash PreviewlowvsGPT-5.4 Minimedium KAT-Coder-Pro V2.5lowvsGPT-5.4 Minimedium Claude Sonnet 4.6nonevsGPT-5.4 Minimedium DeepSeek V4 ProhighvsGPT-5.4 Minimedium