AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs OpenAI: GPT-5 Mini

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-28

मेट्रिक	Claude Opus 4.8 Claude Opus 4.8 none रिलीज़: 2026-05-28	GPT-5 Mini GPT-5 Mini medium रिलीज़: 2025-08-07

मेट्रिक	Claude Opus 4.8 Claude Opus 4.8 none रिलीज़: 2026-05-28	GPT-5 Mini GPT-5 Mini medium रिलीज़: 2025-08-07
स्कोर	7.3	7.2
रैंक	#63	#70
विश्वसनीयता	10.0	10.0
संगति	9.2	9.1
सही परीक्षण
प्रति प्रयास पास दर	65.0%	61.7%
अस्थिर टेस्ट	2	2
कुल रन	60	60
प्रति परिणाम लागत	4.324	1.348
कुल लागत	$0.519	$0.149
इनपुट कीमत	$5.000 / 1M	$0.250 / 1M
आउटपुट कीमत	$25.000 / 1M	$2.000 / 1M
आउटपुट टोकन	8,098	6,723
रीजनिंग टोकन	0	63,082
प्रतिक्रिया समय (औसत)	3.51s	23.75s
प्रतिक्रिया समय (अधिकतम)	17.73s	88.15s
प्रतिक्रिया समय (कुल)	70.19s	475.03s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	6.5	10.0	50.0%	0		3.40s	1,472	0
GPT-5 Mini	7.1	7.6	66.7%	1		13.86s	1,715	6,378

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	6.8	10.0	50.0%	0		3.59s	1,323	0
GPT-5 Mini	10.0	10.0	100.0%	0		30.74s	580	12,544

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	9.5	10.0	100.0%	0		17.73s	3,259	0
GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	754	11,520

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	7.3	5.8	83.3%	1		1.77s	308	0
GPT-5 Mini	10.0	10.0	100.0%	0		12.58s	453	3,200

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	5.3	7.2	44.4%	1		1.66s	61	0
GPT-5 Mini	3.6	7.2	22.2%	1		44.63s	293	14,016

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	10.0	10.0	100.0%	0		3.48s	230	0
GPT-5 Mini	4.5	10.0	0.0%	0		13.50s	349	1,856

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	9.9	10.0	100.0%	0		1.37s	95	0
GPT-5 Mini	10.0	10.0	100.0%	0		11.59s	310	3,968

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	7.7	10.0	66.7%	0		2.74s	783	0
GPT-5 Mini	5.6	9.8	33.3%	0		15.20s	1,622	6,144

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	10.0	10.0	100.0%	0		5.35s	355	0
GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	487	1,600

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.8	3.0	10.0	0.0%	0		3.41s	212	0
GPT-5 Mini	3.0	10.0	0.0%	0		9.99s	160	1,856

त्वरित तुलना

तुलना जोड़ी बदलें

Claude Opus 4.8nonevsQwen3.5-35B-A3Bmedium Claude Opus 4.8nonevsRing-2.6-1Tmedium Claude Opus 4.8nonevsGPT-5.4 Minimedium Claude Opus 4.8nonevsGPT-5.2medium Ring-2.6-1TnonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.6 Max Previewnone Claude Opus 4.8nonevsGLM 5V Turbomedium Claude Opus 4.8nonevsGPT-5.4 Nanomedium Claude Opus 4.8nonevsStep 3.5 Flashmedium Claude Opus 4.8nonevsKimi K2.6mediumनिःशुल्क उपलब्ध Claude Opus 4.8nonevsMiMo-V2.5medium Claude Sonnet 4.6nonevsGPT-5 Minimedium