तुलना करें चार्ट

भाषा:

❤️ Made by XCS

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-35B-A3B

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-05

मेट्रिक	OpenAI: GPT-5.4 none रिलीज़: 2026-03-05	Qwen: Qwen3.5-35B-A3B none रिलीज़: 2026-02-24
रैंक	#44	#43
औसत स्कोर	4.6	4.7
सही परीक्षण
संगति	8.9	8.9
प्रति परिणाम लागत	1.496	0.233
कुल लागत	$0.090	$0.014
प्रति प्रयास पास दर	44.4%	48.9%
अस्थिर टेस्ट	2	2
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
आउटपुट टोकन	1,635	3,642
रीजनिंग टोकन	0	0
प्रतिक्रिया समय (औसत)	1.46s	4.30s
प्रतिक्रिया समय (अधिकतम)	2.89s	47.43s
प्रतिक्रिया समय (कुल)	21.86s	64.43s

स्कोर के अनुसार शीर्ष मॉडल

प्रतिक्रिया समय (औसत)

स्कोर बनाम कुल लागत

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0
Qwen: Qwen3.5-35B-A3B	10.0	7.2	22.2%	1		1.76s	569	0

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0
Qwen: Qwen3.5-35B-A3B	10.0	10.0	0.0%	0		47.43s	1,833	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0
Qwen: Qwen3.5-35B-A3B	9.9	10.0	100.0%	0		1.16s	243	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0
Qwen: Qwen3.5-35B-A3B	7.0	10.0	66.7%	0		485ms	15	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0
Qwen: Qwen3.5-35B-A3B	5.0	10.0	50.0%	0		809ms	63	0

Puzzle Solving	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0
Qwen: Qwen3.5-35B-A3B	1.7	7.4	22.2%	1		1.34s	655	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0
Qwen: Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		2.30s	264	0

त्वरित तुलना

तुलना जोड़ी बदलें

MiniMax M2.5mediumvsQwen3.5-35B-A3Bnone MiniMax M2.5mediumvsGPT-5.4none gpt-oss-120bmediumनिःशुल्क उपलब्धvsQwen3.5-35B-A3Bnone Mercury 2mediumvsQwen3.5-35B-A3Bnone Mercury 2mediumvsGPT-5.4none GPT-5 NanomediumvsQwen3.5-35B-A3Bnone GPT-5.4nonevsQwen3.5-35B-A3Bmedium GPT-5.4nonevsQwen3 Coder Nextmedium GPT-5.4nonevsGLM 4.7 Flashmedium GPT-5 MinimediumvsQwen3.5-35B-A3Bnone Qwen3.5-35B-A3BnonevsGLM 4.7 Flashmedium Claude Opus 4.6mediumvsQwen3.5-35B-A3Bnone