AI BENCHY तुलना

OpenAI: GPT-5.2 vs OpenAI: GPT-5.5

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22

मेट्रिक	GPT-5.2 GPT-5.2 medium रिलीज़: 2025-12-11	GPT-5.5 GPT-5.5 none रिलीज़: 2026-04-24

मेट्रिक	GPT-5.2 GPT-5.2 medium रिलीज़: 2025-12-11	GPT-5.5 GPT-5.5 none रिलीज़: 2026-04-24
स्कोर	7.4	6.5
रैंक	#57	#86
विश्वसनीयता	10.0	10.0
संगति	8.3	8.7
सही परीक्षण
प्रति प्रयास पास दर	70.0%	56.7%
अस्थिर टेस्ट	4	3
कुल रन	60	60
प्रति परिणाम लागत	4.081	2.165
कुल लागत	$0.490	$0.217
???? ???	$1.750 / 1M	$5.000 / 1M
????? ???	$14.000 / 1M	$30.000 / 1M
आउटपुट टोकन	2,754	1,949
रीजनिंग टोकन	28,303	0
प्रतिक्रिया समय (औसत)	16.44s	1.94s
प्रतिक्रिया समय (अधिकतम)	77.80s	5.56s
प्रतिक्रिया समय (कुल)	213.77s	38.86s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	6.5	8.0	58.3%	1		7.81s	567	2,002
GPT-5.5	6.9	7.9	66.7%	1		1.31s	213	0

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	10.0	10.0	100.0%	0		23.15s	490	8,269
GPT-5.5	6.8	10.0	50.0%	0		1.52s	447	0

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	10.0	10.0	100.0%	0		14.06s	291	1,757
GPT-5.5	3.0	10.0	0.0%	0		5.56s	300	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	10.0	10.0	100.0%	0		3.15s	234	420
GPT-5.5	10.0	10.0	100.0%	0		1.18s	222	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	5.9	7.2	55.6%	1		77.80s	42	10,342
GPT-5.5	2.9	7.2	11.1%	1		1.31s	52	0

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	3.7	9.7	0.0%	0		4.32s	162	269
GPT-5.5	10.0	10.0	100.0%	0		3.41s	124	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	9.9	10.0	100.0%	0		3.12s	94	614
GPT-5.5	6.2	5.8	66.7%	1		1.15s	81	0

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	7.6	7.3	77.8%	1		5.47s	609	938
GPT-5.5	7.7	10.0	66.7%	0		1.36s	245	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	4.7	1.6	66.7%	1		10.30s	239	469
GPT-5.5	10.0	10.0	100.0%	0		3.90s	247	0

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.2	3.0	10.0	0.0%	0		28.18s	26	3,223
GPT-5.5	3.0	10.0	0.0%	0		5.01s	18	0

त्वरित तुलना

तुलना जोड़ी बदलें

DeepSeek V4 Flashhighनिःशुल्क उपलब्धvsGPT-5.2medium GPT-5.5nonevsQwen3.6 27Bmedium Gemini 3.1 Flash LitelowvsGPT-5.2medium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.2medium DeepSeek V4 ProhighvsGPT-5.5none Kimi K2.5mediumvsGPT-5.5none Gemini 3.1 Flash LiteminimalvsGPT-5.5none Ring-2.6-1TnonevsGPT-5.2medium GPT-5.5nonevsGrok 4.20medium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2medium Gemini 3 Flash PreviewnonevsGPT-5.2medium GPT-5.2mediumvsQwen3.6 Max Previewnone