तुलना करें चार्ट Karyapranali

भाषा:

❤️ Made by XCS

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-35B-A3B

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-06

मेट्रिक	OpenAI: GPT-5.4 none रिलीज़: 2026-03-05	Qwen: Qwen3.5-35B-A3B medium रिलीज़: 2026-02-24
औसत स्कोर	4.6	5.8
रैंक	#45	#34
सही परीक्षण
संगति	8.9	6.7
प्रति परिणाम लागत	1.496	4.189
कुल लागत	$0.090	$0.336
प्रति प्रयास पास दर	44.4%	80.0%
अस्थिर टेस्ट	2	6
common.totalRuns	45 (15 x 3)	45 (15 x 3)
आउटपुट टोकन	1,635	5,475
रीजनिंग टोकन	0	165,513
प्रतिक्रिया समय (औसत)	1.46s	44.84s
प्रतिक्रिया समय (अधिकतम)	2.89s	106.00s
प्रतिक्रिया समय (कुल)	21.86s	672.55s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0
Qwen: Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.75s	429	36,235

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0
Qwen: Qwen3.5-35B-A3B	10.0	1.6	66.7%	1		75.34s	775	12,485

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0
Qwen: Qwen3.5-35B-A3B	5.5	5.9	83.3%	1		59.33s	235	19,493

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0
Qwen: Qwen3.5-35B-A3B	10.0	4.4	44.5%	2		88.34s	41	46,368

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0
Qwen: Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	97	17,361

Puzzle Solving	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0
Qwen: Qwen3.5-35B-A3B	4.0	4.4	77.8%	2		31.58s	3,589	32,206

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0
Qwen: Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	309	1,365

त्वरित तुलना

तुलना जोड़ी बदलें

Qwen3.5-35B-A3BmediumvsGLM 5none MiniMax M2.5mediumvsGPT-5.4none Gemini 2.5 FlashnonevsQwen3.5-35B-A3Bmedium DeepSeek V3.2nonevsQwen3.5-35B-A3Bmedium Mercury 2mediumvsGPT-5.4none Claude Sonnet 4.6nonevsQwen3.5-35B-A3Bmedium Gemini 3 Flash PreviewnonevsQwen3.5-35B-A3Bmedium GPT-5.4nonevsQwen3 Coder Nextmedium GPT-5.4nonevsGLM 4.7 Flashmedium Trinity Large Preview (free)noneनिःशुल्क उपलब्धvsQwen3.5-35B-A3Bmedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-35B-A3Bmedium GPT-4o-mininonevsQwen3.5-35B-A3Bmedium