नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Opus 4.7 vs OpenAI: GPT-5.3-Codex

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 none रिलीज़: 2026-04-16 GPT-5.3-Codex GPT-5.3-Codex medium रिलीज़: 2026-02-05
स्कोर 9.2 8.6
रैंक #4 #7
संगति 10.0 8.7
सही परीक्षण
प्रति प्रयास पास दर 88.9% 83.3%
अस्थिर टेस्ट 0 3
कुल रन 54 54
प्रति परिणाम लागत 3.155 4.405
कुल लागत $0.505 $0.573
???? ??? $5.000 / 1M $1.750 / 1M
????? ??? $25.000 / 1M $14.000 / 1M
आउटपुट टोकन 6,326 2,279
रीजनिंग टोकन 0 35,179
प्रतिक्रिया समय (औसत) 3.13s 15.38s
प्रतिक्रिया समय (अधिकतम) 18.27s 100.93s
प्रतिक्रिया समय (कुल) 56.33s 276.91s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 8.3 10.0 75.0% 0 2.12s 522 0
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.84s 494 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 8.95s 491 1,530
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 9.5 10.0 100.0% 0 18.27s 3,504 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.15s 324 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 7.7 10.0 66.7% 0 1.19s 78 0
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 3.47s 257 0
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 1.46s 114 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.58s 661 0
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 4.74s 372 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492

त्वरित तुलना

तुलना जोड़ी बदलें