AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs OpenAI: GPT-5.2

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-30

मेट्रिक	Claude Opus 4.6 Claude Opus 4.6 medium प्रकाशन: 2026-02-05	GPT-5.2 GPT-5.2 medium प्रकाशन: 2025-12-11

मेट्रिक	Claude Opus 4.6 Claude Opus 4.6 medium प्रकाशन: 2026-02-05	GPT-5.2 GPT-5.2 medium प्रकाशन: 2025-12-11
स्कोअर	7.6	7.5
क्रमांक	#49	#53
विश्वसनीयता	लागू नाही	लागू नाही
सुसंगतता	9.1	8.1
बरोबर चाचण्या
प्रति प्रयत्न पास दर	70.4%	72.2%
अस्थिर चाचण्या	2	4
एकूण रन	54	54
प्रति निकाल खर्च	12.047	3.193
एकूण खर्च	$1.446	$0.352
???? ???	$5.000 / 1M	$1.750 / 1M
????? ???	$25.000 / 1M	$14.000 / 1M
आउटपुट टोकन्स	29,829	2,705
रिझनिंग टोकन्स	18,938	18,977
प्रतिसाद वेळ (सरासरी)	21.08s	14.04s
प्रतिसाद वेळ (कमाल)	83.40s	77.80s
प्रतिसाद वेळ (एकूण)	231.84s	154.41s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.6	6.4	5.8	66.7%	2		7.45s	986	1,071
GPT-5.2	6.5	8.0	58.3%	1		7.81s	567	2,002

कोडिंग	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.6	10.0	10.0	100.0%	0		23.11s	3,486	1,504
GPT-5.2	10.0	10.0	100.0%	0		15.12s	467	2,166

संयुक्त	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.6	10.0	10.0	100.0%	0		76.66s	8,178	5,194
GPT-5.2	10.0	10.0	100.0%	0		14.06s	291	1,757

डेटा पार्सिंग आणि निष्कर्षण	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.6	10.0	10.0	100.0%	0		7.37s	691	757
GPT-5.2	10.0	10.0	100.0%	0		3.15s	234	420

डोमेन-विशिष्ट	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.6	3.0	10.0	0.0%	0		83.40s	14,642	8,687
GPT-5.2	5.9	7.2	55.6%	1		77.80s	42	10,342

Samanya Buddhimatta	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.6	10.0	10.0	100.0%	0		5.04s	188	292
GPT-5.2	3.7	9.7	0.0%	0		4.32s	162	269

सूचनांचे पालन	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.6	10.0	10.0	100.0%	0		2.43s	266	467
GPT-5.2	9.9	10.0	100.0%	0		3.12s	94	614

कोडी सोडवणे	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.6	7.7	10.0	66.7%	0		4.60s	531	637
GPT-5.2	7.7	7.3	77.8%	1		5.47s	609	938

टूल कॉलिंग	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.6	10.0	10.0	100.0%	0		9.73s	861	329
GPT-5.2	4.7	1.6	66.7%	1		10.30s	239	469

झटपट तुलना

तुलना जोडी बदला

GPT-5.2mediumvsQwen3.6 Max Previewnone Claude Sonnet 4.6nonevsGPT-5.2medium Claude Opus 4.6mediumvsQwen3.6 Max Previewnone Claude Opus 4.6mediumvsDeepSeek V4 Flashhigh Claude Opus 4.6mediumvsGPT-5.3 Chatnone Claude Opus 4.6mediumvsGemini 3.1 Flash Lite Previewnone Claude Opus 4.6mediumvsGPT-5.2 Chatnone DeepSeek V4 FlashhighvsGPT-5.2medium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.2medium Claude Opus 4.6mediumvsGemini 3.1 Flash Lite Previewlow Claude Opus 4.6mediumvsGemini 3 Flash Previewnone Claude Opus 4.6mediumvsHY3 Previewlowमोफत उपलब्ध