Anthropic: Claude Fable 5 vs OpenAI: GPT-5.5

GPT-5.5 (low) average score में आगे है: 9.3 vs 8.6. GPT-5.5 (low) की benchmark लागत कम है: $1.253 vs $3.478. GPT-5.5 (low) तेज है: 10.13s vs 17.20s, pass rates 78.8% vs 86.4%.

अनुशंसित मॉडलGPT-5.5 (low)It has the best score here (9.3), while costing about 2.8x less than Claude Fable 5 (medium).

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-25

मेट्रिक	Claude Fable 5 Claude Fable 5 medium रिलीज़: 2026-06-10	GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24

मेट्रिक	Claude Fable 5 Claude Fable 5 medium रिलीज़: 2026-06-10	GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24
स्कोर	8.6	9.3
रैंक	#22	#9
विश्वसनीयता	10.0	10.0
संगति	9.6	10.0
सही परीक्षण
प्रति प्रयास पास दर	78.8%	86.4%
अस्थिर टेस्ट	1	0
कुल रन	66	66
प्रति परिणाम लागत	20.459	6.594
कुल लागत	$3.478	$1.253
इनपुट कीमत	$10.000 / 1M	$5.000 / 1M
आउटपुट कीमत	$50.000 / 1M	$30.000 / 1M
कुल इनपुट टोकन	89,643	80,058
आउटपुट टोकन	41,360	5,378
रीजनिंग टोकन	10,269	23,040
प्रतिक्रिया समय (औसत)	17.20s	10.13s
प्रतिक्रिया समय (अधिकतम)	80.80s	56.19s
प्रतिक्रिया समय (कुल)	378.41s	222.82s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#22 Claude Fable 5

medium

लागत: $0.606
समय: 156.7s
टोकन: 12,264 tok

#9 GPT-5.5

low

लागत: $0.068
समय: 37.0s
टोकन: 2,339 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

श्रेणी:

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	10.0	10.0	100.0%	0		6.20s	834	530	402
GPT-5.5	10.0	10.0	100.0%	0		4.41s	606	238	1,020

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	10.0	10.0	100.0%	0		15.59s	10,590	7,383	1,318
GPT-5.5	10.0	10.0	100.0%	0		15.04s	7,302	423	6,402

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	6.5	10.0	50.0%	0		27.47s	52,197	2,373	1,599
GPT-5.5	10.0	10.0	100.0%	0		13.73s	56,868	3,635	1,297

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	10.0	10.0	100.0%	0		7.18s	10,503	521	363
GPT-5.5	10.0	10.0	100.0%	0		3.28s	7,140	228	157

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	5.3	7.2	44.4%	1		53.40s	975	25,215	5,001
GPT-5.5	5.3	10.0	33.3%	0		28.05s	723	69	11,609

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	10.0	10.0	100.0%	0		7.42s	708	366	144
GPT-5.5	10.0	10.0	100.0%	0		5.17s	477	133	245

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	10.0	10.0	100.0%	0		5.90s	909	139	202
GPT-5.5	9.9	10.0	100.0%	0		3.74s	660	93	415

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	7.7	10.0	66.7%	0		5.18s	894	402	324
GPT-5.5	10.0	10.0	100.0%	0		4.74s	642	279	954

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	10.0	10.0	100.0%	0		16.96s	11,775	729	344
GPT-5.5	10.0	10.0	100.0%	0		4.96s	5,445	250	101

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	3.0	10.0	0.0%	0		25.64s	258	3,702	572
GPT-5.5	3.0	10.0	0.0%	0		10.06s	195	30	840

त्वरित तुलना

तुलना जोड़ी बदलें

Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Claude Opus 5highvsGPT-5.5low Claude Opus 5mediumvsGPT-5.5low GPT-5.5lowvsQwen3.7 Maxmedium Gemini 3.5 FlashmediumvsGPT-5.5low Gemini 3.5 FlashhighvsGPT-5.5low Claude Fable 5mediumvsGrok 4.5low Gemini 3 Flash PreviewmediumvsGPT-5.5low Claude Fable 5mediumvsGrok 4.5high Claude Fable 5mediumvsGemini 3.5 Flashlow Gemini 3.6 FlashhighvsGPT-5.5low Claude Fable 5mediumvsMuse Spark 1.1low