नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs OpenAI: GPT-5.4

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-04

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 medium प्रकाशन: 2026-05-28 GPT-5.4 GPT-5.4 medium प्रकाशन: 2026-03-05
स्कोअर 8.7 8.0
क्रमांक #10 #21
विश्वसनीयता 10.0 10.0
सुसंगतता 9.6 8.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 84.1% 76.2%
अस्थिर चाचण्या 1 4
एकूण रन 63 63
प्रति निकाल खर्च 6.512 8.640
एकूण खर्च $1.107 $1.210
इनपुट किंमत $5.000 / 1M $2.500 / 1M
आउटपुट किंमत $25.000 / 1M $15.000 / 1M
एकूण इनपुट टोकन्स 61,007 34,108
आउटपुट टोकन्स 26,495 2,242
रिझनिंग टोकन्स 5,901 72,707
प्रतिसाद वेळ (सरासरी) 9.66s 22.35s
प्रतिसाद वेळ (कमाल) 38.03s 100.41s
प्रतिसाद वेळ (एकूण) 202.89s 469.29s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 834 1,179 478
GPT-5.4 8.3 10.0 75.0% 0 4.11s 606 240 1,511
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 15.33s 10,590 9,945 1,381
GPT-5.4 8.8 7.8 88.9% 1 44.36s 7,305 433 24,216
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 23,561 5,260 1,588
GPT-5.4 10.0 10.0 100.0% 0 20.57s 11,019 301 3,543
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 10,503 481 312
GPT-5.4 10.0 10.0 100.0% 0 5.32s 7,140 234 804
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 975 7,477 900
GPT-5.4 5.3 7.2 44.4% 1 74.27s 619 61 34,748
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 708 237 0
GPT-5.4 4.7 3.1 33.3% 1 4.92s 477 145 321
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 909 373 320
GPT-5.4 10.0 10.0 100.0% 0 3.11s 660 93 897
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 894 791 483
GPT-5.4 8.2 7.2 88.9% 1 9.14s 642 441 3,815
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 11,775 301 225
GPT-5.4 10.0 10.0 100.0% 0 13.28s 5,445 264 1,031
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 258 451 214
GPT-5.4 3.0 10.0 0.0% 0 13.95s 195 30 1,821

झटपट तुलना

तुलना जोडी बदला