तुलना करें चार्ट Karyapranali

भाषा:

❤️ Made by XCS

AI BENCHY तुलना

OpenAI: GPT-5.2 Chat vs Qwen: Qwen3.5-Flash

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-06

मेट्रिक	OpenAI: GPT-5.2 Chat none रिलीज़: 2025-12-11	Qwen: Qwen3.5-Flash medium रिलीज़: 2026-02-24
रैंक	#15	#24
औसत स्कोर	7.4	6.9
संगति	9.1	7.5
प्रति परिणाम लागत	2.440	0.720
कुल लागत	$0.269	$0.072
सही परीक्षण
प्रति प्रयास पास दर	75.0%	81.3%
अस्थिर टेस्ट	2	5
common.totalRuns	48 (16 x 3)	48 (16 x 3)
आउटपुट टोकन	15,845	1,807
रीजनिंग टोकन	0	169,952
प्रतिक्रिया समय (औसत)	7.03s	70.81s
प्रतिक्रिया समय (अधिकतम)	38.52s	234.29s
प्रतिक्रिया समय (कुल)	112.51s	1132.90s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.2 Chat	10.0	10.0	100.0%	0		3.97s	1,651	0
Qwen: Qwen3.5-Flash	10.0	10.0	100.0%	0		71.35s	363	23,645

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.2 Chat	10.0	10.0	100.0%	0		9.12s	1,243	0
Qwen: Qwen3.5-Flash	10.0	10.0	100.0%	0		17.78s	483	8,270

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.2 Chat	9.9	10.0	100.0%	0		3.05s	980	0
Qwen: Qwen3.5-Flash	5.5	5.9	83.3%	1		56.99s	235	16,237

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.2 Chat	4.0	10.0	33.3%	0		17.78s	7,810	0
Qwen: Qwen3.5-Flash	4.0	7.2	44.4%	1		146.50s	58	43,615

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.2 Chat	4.0	3.0	33.3%	1		3.20s	335	0
Qwen: Qwen3.5-Flash	5.0	3.1	66.7%	1		40.05s	99	38,486

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.2 Chat	6.0	6.1	83.3%	1		5.46s	1,528	0
Qwen: Qwen3.5-Flash	10.0	10.0	100.0%	0		63.49s	98	14,139

Puzzle Solving	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.2 Chat	7.0	10.0	66.7%	0		4.42s	1,743	0
Qwen: Qwen3.5-Flash	4.0	4.4	77.8%	2		56.74s	162	24,276

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
OpenAI: GPT-5.2 Chat	10.0	10.0	100.0%	0		4.68s	555	0
Qwen: Qwen3.5-Flash	10.0	10.0	100.0%	0		10.33s	309	1,284

त्वरित तुलना

तुलना जोड़ी बदलें

GPT-5.2 ChatnonevsGLM 5medium Gemini 2.5 FlashmediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsStep 3.5 Flashmediumनिःशुल्क उपलब्ध Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone Claude Sonnet 4.6nonevsQwen3.5-Flashmedium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2 Chatnone DeepSeek V3.2mediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-Flashmedium GPT-5.2 ChatnonevsMiMo-V2-Flashmedium Claude Sonnet 4.6mediumvsGPT-5.2 Chatnone Gemini 3 Flash PreviewnonevsQwen3.5-Flashmedium GPT-5.2 ChatnonevsQwen3.5-122B-A10Bmedium