तुलना करें चार्ट Karyapranali

भाषा:

❤️ Made by XCS

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-27B

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-06

मेट्रिक	OpenAI: GPT-5.4 none रिलीज़: 2026-03-05	Qwen: Qwen3.5-27B none रिलीज़: 2026-02-24
औसत स्कोर	4.6	4.9
रैंक	#44	#41
सही परीक्षण
संगति	8.9	9.0
प्रति परिणाम लागत	1.496	0.297
कुल लागत	$0.090	$0.015
प्रति प्रयास पास दर	44.4%	40.0%
अस्थिर टेस्ट	2	2
common.totalRuns	45 (15 x 3)	45 (15 x 3)
आउटपुट टोकन	1,635	3,035
रीजनिंग टोकन	0	0
प्रतिक्रिया समय (औसत)	1.46s	1.70s
प्रतिक्रिया समय (अधिकतम)	2.89s	9.39s
प्रतिक्रिया समय (कुल)	21.86s	25.55s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0
Qwen: Qwen3.5-27B	4.0	10.0	33.3%	0		796ms	264	0

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0
Qwen: Qwen3.5-27B	10.0	1.6	33.3%	1		9.39s	1,461	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0
Qwen: Qwen3.5-27B	9.9	10.0	100.0%	0		1.43s	243	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0
Qwen: Qwen3.5-27B	10.0	10.0	0.0%	0		540ms	15	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0
Qwen: Qwen3.5-27B	4.5	10.0	0.0%	0		815ms	69	0

Puzzle Solving	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0
Qwen: Qwen3.5-27B	6.3	7.9	55.6%	1		1.37s	680	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0
Qwen: Qwen3.5-27B	10.0	10.0	100.0%	0		3.54s	303	0

त्वरित तुलना

तुलना जोड़ी बदलें

MiniMax M2.5mediumvsQwen3.5-27Bnone MiniMax M2.5mediumvsGPT-5.4none gpt-oss-120bmediumनिःशुल्क उपलब्धvsQwen3.5-27Bnone Mercury 2mediumvsQwen3.5-27Bnone GPT-5 NanomediumvsQwen3.5-27Bnone Mercury 2mediumvsGPT-5.4none GPT-5 MinimediumvsQwen3.5-27Bnone GPT-5.4nonevsQwen3.5-35B-A3Bmedium GPT-5.4nonevsQwen3 Coder Nextmedium GPT-5.4nonevsGLM 4.7 Flashmedium Claude Opus 4.6mediumvsQwen3.5-27Bnone Kimi K2.5mediumvsQwen3.5-27Bnone