AI BENCHY तुलना

OpenAI: GPT-5.2 vs Qwen: Qwen3.6 Max Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-27

मेट्रिक	GPT-5.2 GPT-5.2 medium रिलीज़: 2025-12-11	Qwen3.6 Max Preview Qwen3.6 Max Preview none रिलीज़: 2026-04-20

मेट्रिक	GPT-5.2 GPT-5.2 medium रिलीज़: 2025-12-11	Qwen3.6 Max Preview Qwen3.6 Max Preview none रिलीज़: 2026-04-20
स्कोर	7.5	7.3
रैंक	#52	#56
विश्वसनीयता	लागू नहीं	10.0
संगति	8.1	8.7
सही परीक्षण
प्रति प्रयास पास दर	72.2%	66.7%
अस्थिर टेस्ट	4	3
कुल रन	54	54
प्रति परिणाम लागत	3.193	0.827
कुल लागत	$0.352	$0.083
???? ???	$1.750 / 1M	$1.300 / 1M
????? ???	$14.000 / 1M	$7.800 / 1M
आउटपुट टोकन	2,705	4,732
रीजनिंग टोकन	18,977	0
प्रतिक्रिया समय (औसत)	14.04s	3.38s
प्रतिक्रिया समय (अधिकतम)	77.80s	20.51s
प्रतिक्रिया समय (कुल)	154.41s	60.83s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	6.5	8.0	58.3%	1		7.81s	567	2,002
Qwen3.6 Max Preview	5.2	7.9	41.7%	1		2.63s	513	0

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	10.0	10.0	100.0%	0		15.12s	467	2,166
Qwen3.6 Max Preview	5.0	2.0	66.7%	1		3.45s	426	0

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	10.0	10.0	100.0%	0		14.06s	291	1,757
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		20.51s	2,842	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	10.0	10.0	100.0%	0		3.15s	234	420
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		2.87s	243	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	5.9	7.2	55.6%	1		77.80s	42	10,342
Qwen3.6 Max Preview	7.7	10.0	66.7%	0		1.22s	18	0

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	3.7	9.7	0.0%	0		4.32s	162	269
Qwen3.6 Max Preview	4.3	10.0	0.0%	0		1.62s	76	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	9.9	10.0	100.0%	0		3.12s	94	614
Qwen3.6 Max Preview	8.4	6.9	83.3%	1		1.45s	69	0

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	7.7	7.3	77.8%	1		5.47s	609	938
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		2.38s	323	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	4.7	1.6	66.7%	1		10.30s	239	469
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		5.27s	222	0

त्वरित तुलना

तुलना जोड़ी बदलें

Claude Sonnet 4.6nonevsGPT-5.2medium GPT-5.4 MinimediumvsQwen3.6 Max Previewnone Qwen3.6 Max PreviewnonevsMiMo-V2-Flashmedium Seed-2.0-MinimediumvsQwen3.6 Max Previewnone GPT-5.4 NanomediumvsQwen3.6 Max Previewnone Claude Opus 4.6mediumvsQwen3.6 Max Previewnone GPT-5 MinimediumvsQwen3.6 Max Previewnone Kimi K2.5mediumvsQwen3.6 Max Previewnone Qwen3.6 Max PreviewnonevsMiMo-V2-Omnimedium DeepSeek V4 FlashhighvsGPT-5.2medium Qwen3.6 Max PreviewnonevsGrok 4.20medium Kimi K2.6mediumvsQwen3.6 Max Previewnone