नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs OpenAI: GPT-5.3 Chat

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 none रिलीज़: 2026-05-28 GPT-5.3 Chat GPT-5.3 Chat none रिलीज़: 2026-03-03
स्कोर 7.3 7.4
रैंक #63 #56
विश्वसनीयता 10.0 10.0
संगति 9.2 8.4
सही परीक्षण
प्रति प्रयास पास दर 65.0% 68.3%
अस्थिर टेस्ट 2 4
कुल रन 60 60
प्रति परिणाम लागत 4.324 3.350
कुल लागत $0.519 $0.402
इनपुट कीमत $5.000 / 1M $1.750 / 1M
आउटपुट कीमत $25.000 / 1M $14.000 / 1M
आउटपुट टोकन 8,098 24,757
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 3.51s 6.13s
प्रतिक्रिया समय (अधिकतम) 17.73s 18.33s
प्रतिक्रिया समय (कुल) 70.19s 122.61s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
GPT-5.3 Chat 6.9 6.2 66.7% 1 10.52s 4,772 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 1,491 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 1,758 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 569 0

त्वरित तुलना

तुलना जोड़ी बदलें