नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Opus 4.6 vs OpenAI: GPT-5.3 Chat

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium रिलीज़: 2026-02-05 GPT-5.3 Chat GPT-5.3 Chat none रिलीज़: 2026-03-03
स्कोर 7.6 7.7
रैंक #36 #35
संगति 9.1 8.6
सही परीक्षण
प्रति प्रयास पास दर 70.4% 68.5%
अस्थिर टेस्ट 2 3
कुल रन 54 54
प्रति परिणाम लागत 12.047 3.082
कुल लागत $1.446 $0.340
???? ??? $5.000 / 1M $1.750 / 1M
????? ??? $25.000 / 1M $14.000 / 1M
आउटपुट टोकन 29,829 20,784
रीजनिंग टोकन 18,938 0
प्रतिक्रिया समय (औसत) 21.08s 5.88s
प्रतिक्रिया समय (अधिकतम) 83.40s 18.33s
प्रतिक्रिया समय (कुल) 231.84s 105.90s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
GPT-5.3 Chat 10.0 10.0 100.0% 0 9.32s 1,436 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
GPT-5.3 Chat 8.3 10.0 50.0% 0 3.29s 1,455 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0

त्वरित तुलना

तुलना जोड़ी बदलें