तुलना करें चार्ट

भाषा:

❤️ Made by XCS

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-Flash

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-05

मेट्रिक	OpenAI: GPT-5.4 none रिलीज़: 2026-03-05	Qwen: Qwen3.5-Flash none रिलीज़: 2026-02-24
रैंक	#44	#40
औसत स्कोर	4.6	4.9
सही परीक्षण
संगति	8.9	9.5
प्रति परिणाम लागत	1.496	0.088
कुल लागत	$0.090	$0.006
प्रति प्रयास पास दर	44.4%	42.2%
अस्थिर टेस्ट	2	1
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
आउटपुट टोकन	1,635	3,674
रीजनिंग टोकन	0	0
प्रतिक्रिया समय (औसत)	1.46s	3.73s
प्रतिक्रिया समय (अधिकतम)	2.89s	13.73s
प्रतिक्रिया समय (कुल)	21.86s	55.90s

स्कोर के अनुसार शीर्ष मॉडल

प्रतिक्रिया समय (औसत)

स्कोर बनाम कुल लागत

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0
Qwen: Qwen3.5-Flash	2.3	7.8	11.1%	1		1.62s	687	0

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0
Qwen: Qwen3.5-Flash	10.0	10.0	0.0%	0		6.22s	1,794	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0
Qwen: Qwen3.5-Flash	9.9	10.0	100.0%	0		1.57s	243	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0
Qwen: Qwen3.5-Flash	7.0	10.0	66.7%	0		905ms	15	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0
Qwen: Qwen3.5-Flash	5.0	10.0	50.0%	0		8.81s	63	0

Puzzle Solving	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0
Qwen: Qwen3.5-Flash	1.3	10.0	0.0%	0		5.90s	608	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0
Qwen: Qwen3.5-Flash	10.0	10.0	100.0%	0		3.67s	264	0

त्वरित तुलना

तुलना जोड़ी बदलें

MiniMax M2.5mediumvsQwen3.5-Flashnone MiniMax M2.5mediumvsGPT-5.4none gpt-oss-120bmediumनिःशुल्क उपलब्धvsQwen3.5-Flashnone Mercury 2mediumvsQwen3.5-Flashnone GPT-5 NanomediumvsQwen3.5-Flashnone Mercury 2mediumvsGPT-5.4none GPT-5 MinimediumvsQwen3.5-Flashnone GPT-5.4nonevsQwen3.5-35B-A3Bmedium GPT-5.4nonevsQwen3 Coder Nextmedium GPT-5.4nonevsGLM 4.7 Flashmedium Claude Opus 4.6mediumvsQwen3.5-Flashnone Kimi K2.5mediumvsQwen3.5-Flashnone