तुलना करा चार्ट्स Paddhati

भाषा:

❤️ Made by XCS

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs OpenAI: GPT-5.4

तुलना करा:

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-06

मेट्रिक	Anthropic: Claude Opus 4.6 medium प्रकाशन: 2026-02-05	OpenAI: GPT-5.4 none प्रकाशन: 2026-03-05
सरासरी स्कोअर	6.4	4.6
क्रमांक	#30	#44
बरोबर चाचण्या
सुसंगतता	8.9	8.9
प्रति निकाल खर्च	14.411	1.496
एकूण खर्च	$1.297	$0.090
प्रति प्रयत्न पास दर	64.4%	44.4%
अस्थिर चाचण्या	2	2
common.totalRuns	45 (15 x 3)	45 (15 x 3)
आउटपुट टोकन्स	26,066	1,635
रिझनिंग टोकन्स	17,071	0
प्रतिसाद वेळ (सरासरी)	25.08s	1.46s
प्रतिसाद वेळ (कमाल)	83.40s	2.89s
प्रतिसाद वेळ (एकूण)	200.67s	21.86s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

श्रेणीवार तपशील

अँटी-एआय युक्त्या	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
Anthropic: Claude Opus 4.6	4.0	4.4	55.6%	2		11.88s	897	1,000
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0

संयुक्त	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
Anthropic: Claude Opus 4.6	10.0	10.0	100.0%	0		76.66s	8,178	5,194
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0

डेटा पार्सिंग आणि निष्कर्षण	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
Anthropic: Claude Opus 4.6	9.9	10.0	100.0%	0		7.37s	691	757
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0

डोमेन-विशिष्ट	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
Anthropic: Claude Opus 4.6	10.0	10.0	0.0%	0		83.40s	14,642	8,687
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0

सूचनांचे पालन	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
Anthropic: Claude Opus 4.6	10.0	10.0	100.0%	0		2.43s	266	467
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0

Puzzle Solving	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
Anthropic: Claude Opus 4.6	7.0	10.0	66.7%	0		4.60s	531	637
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0

टूल कॉलिंग	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	आउटपुट टोकन्स	रिझनिंग टोकन्स
Anthropic: Claude Opus 4.6	10.0	10.0	100.0%	0		9.73s	861	329
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0

झटपट तुलना

तुलना जोडी बदला

Claude Opus 4.6mediumvsQwen3.5 Plus 2026-02-15none MiniMax M2.5mediumvsGPT-5.4none Claude Opus 4.6mediumvsGemini 3 Flash Previewnone Claude Opus 4.6mediumvsGLM 5none Mercury 2mediumvsGPT-5.4none Claude Opus 4.6mediumvsGemini 3.1 Flash Lite Previewnone Claude Opus 4.6mediumvsGPT-5.3 Chatnone Claude Opus 4.6mediumvsGemini 3.1 Flash Lite Previewlow Claude Opus 4.6mediumvsGemini 2.5 Flashnone Claude Opus 4.6mediumvsDeepSeek V3.2none GPT-5.4nonevsQwen3.5-35B-A3Bmedium GPT-5.4nonevsQwen3 Coder Nextmedium