तुलना करें चार्ट

भाषा:

❤️ Made by XCS

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Qwen: Qwen3 Coder Next

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-05

मेट्रिक	OpenAI: GPT-5.4 none रिलीज़: 2026-03-05	Qwen: Qwen3 Coder Next medium रिलीज़: 2026-02-03
रैंक	#44	#51
औसत स्कोर	4.6	3.3
सही परीक्षण
संगति	8.9	9.5
प्रति परिणाम लागत	1.496	0.224
कुल लागत	$0.090	$0.007
प्रति प्रयास पास दर	44.4%	24.4%
अस्थिर टेस्ट	2	1
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
आउटपुट टोकन	1,635	2,793
रीजनिंग टोकन	0	0
प्रतिक्रिया समय (औसत)	1.46s	13.77s
प्रतिक्रिया समय (अधिकतम)	2.89s	81.80s
प्रतिक्रिया समय (कुल)	21.86s	123.93s

स्कोर के अनुसार शीर्ष मॉडल

प्रतिक्रिया समय (औसत)

स्कोर बनाम कुल लागत

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0
Qwen: Qwen3 Coder Next	1.3	7.5	22.2%	1		15.28s	1,246	0

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0
Qwen: Qwen3 Coder Next	10.0	10.0	0.0%	0		4.28s	317	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0
Qwen: Qwen3 Coder Next	5.4	10.0	50.0%	0		81.80s	246	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0
Qwen: Qwen3 Coder Next	4.0	10.0	33.3%	0		638ms	25	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0
Qwen: Qwen3 Coder Next	4.5	10.0	0.0%	0		7.34s	63	0

Puzzle Solving	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0
Qwen: Qwen3 Coder Next	10.0	10.0	0.0%	0		2.30s	641	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0
Qwen: Qwen3 Coder Next	10.0	10.0	100.0%	0		2.64s	255	0

त्वरित तुलना

तुलना जोड़ी बदलें

Mercury 2nonevsQwen3 Coder Nextmedium MiniMax M2.5mediumvsGPT-5.4none Qwen3 Coder NextmediumvsGrok 4.1 Fastnone Kimi K2.5nonevsQwen3 Coder Nextmedium Qwen3 Coder NextmediumvsMiMo-V2-Flashnone Qwen3 Coder NextmediumvsGLM 4.7 Flashnone LFM2-24B-A2BnonevsQwen3 Coder Nextmedium GPT-4o-mininonevsQwen3 Coder Nextmedium Mercury 2mediumvsGPT-5.4none Trinity Large Preview (free)noneनिःशुल्क उपलब्धvsQwen3 Coder Nextmedium GPT-5.4nonevsQwen3.5-35B-A3Bmedium GPT-5.4nonevsGLM 4.7 Flashmedium