OpenAI: GPT-5.5 vs OpenAI: GPT-5.5

GPT-5.5 (low) average score में आगे है: 9.3 vs 9.0. GPT-5.5 (low) की benchmark लागत कम है: $1.253 vs $4.137. GPT-5.5 (low) तेज है: 10.13s vs 38.42s, pass rates 86.4% vs 87.9%.

अनुशंसित मॉडलGPT-5.5 (low)It has the best score here (9.3), while costing about 3.3x less than GPT-5.5 (medium).

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-25

मेट्रिक	GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24	GPT-5.5 GPT-5.5 medium रिलीज़: 2026-04-24

मेट्रिक	GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24	GPT-5.5 GPT-5.5 medium रिलीज़: 2026-04-24
स्कोर	9.3	9.0
रैंक	#9	#15
विश्वसनीयता	10.0	10.0
संगति	10.0	8.9
सही परीक्षण
प्रति प्रयास पास दर	86.4%	87.9%
अस्थिर टेस्ट	0	3
कुल रन	66	66
प्रति परिणाम लागत	6.594	22.980
कुल लागत	$1.253	$4.137
इनपुट कीमत	$5.000 / 1M	$5.000 / 1M
आउटपुट कीमत	$30.000 / 1M	$30.000 / 1M
कुल इनपुट टोकन	80,058	80,659
आउटपुट टोकन	5,378	5,617
रीजनिंग टोकन	23,040	118,819
प्रतिक्रिया समय (औसत)	10.13s	38.42s
प्रतिक्रिया समय (अधिकतम)	56.19s	332.10s
प्रतिक्रिया समय (कुल)	222.82s	845.35s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#9 GPT-5.5

low

लागत: $0.068
समय: 37.0s
टोकन: 2,339 tok

#15 GPT-5.5

medium

लागत: $0.112
समय: 71.9s
टोकन: 3,807 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

श्रेणी:

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.5	10.0	10.0	100.0%	0		4.41s	606	238	1,020
GPT-5.5	10.0	10.0	100.0%	0		4.66s	606	250	1,335

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.5	10.0	10.0	100.0%	0		15.04s	7,302	423	6,402
GPT-5.5	8.8	7.8	88.9%	1		59.77s	7,305	362	24,959

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.5	10.0	10.0	100.0%	0		13.73s	56,868	3,635	1,297
GPT-5.5	10.0	10.0	100.0%	0		33.52s	57,466	3,944	6,735

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.5	10.0	10.0	100.0%	0		3.28s	7,140	228	157
GPT-5.5	10.0	10.0	100.0%	0		4.18s	7,140	234	593

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.5	5.3	10.0	33.3%	0		28.05s	723	69	11,609
GPT-5.5	5.3	7.2	44.4%	1		164.14s	723	67	79,625

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.5	10.0	10.0	100.0%	0		5.17s	477	133	245
GPT-5.5	10.0	10.0	100.0%	0		4.16s	477	138	223

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.5	9.9	10.0	100.0%	0		3.74s	660	93	415
GPT-5.5	10.0	10.0	100.0%	0		3.36s	660	93	538

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.5	10.0	10.0	100.0%	0		4.74s	642	279	954
GPT-5.5	10.0	10.0	100.0%	0		6.76s	642	241	2,225

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.5	10.0	10.0	100.0%	0		4.96s	5,445	250	101
GPT-5.5	10.0	10.0	100.0%	0		10.57s	5,445	258	832

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
GPT-5.5	3.0	10.0	0.0%	0		10.06s	195	30	840
GPT-5.5	2.8	1.6	33.3%	1		37.86s	195	30	1,754

त्वरित तुलना

तुलना जोड़ी बदलें

Gemini 3.5 FlashlowvsGPT-5.5medium GPT-5.5mediumvsGrok 4.5high Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Claude Opus 5highvsGPT-5.5low Claude Opus 5mediumvsGPT-5.5low GPT-5.5lowvsQwen3.7 Maxmedium Gemini 3.5 FlashmediumvsGPT-5.5low Gemini 3.5 FlashhighvsGPT-5.5low Claude Opus 5highvsGPT-5.5medium Gemini 3 Flash PreviewmediumvsGPT-5.5low Gemini 3.6 FlashhighvsGPT-5.5low Gemini 3.6 FlashlowvsGPT-5.5medium