नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Opus 4.7 vs OpenAI: GPT-5.2 Chat

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-29

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 medium रिलीज़: 2026-04-16 GPT-5.2 Chat GPT-5.2 Chat none रिलीज़: 2025-12-11
स्कोर 8.9 7.9
रैंक #7 #33
विश्वसनीयता 10.0 10.0
संगति 10.0 8.9
सही परीक्षण
प्रति प्रयास पास दर 85.0% 73.3%
अस्थिर टेस्ट 0 3
कुल रन 60 60
प्रति परिणाम लागत 3.670 2.703
कुल लागत $0.624 $0.352
इनपुट कीमत $5.000 / 1M $1.750 / 1M
आउटपुट कीमत $25.000 / 1M $14.000 / 1M
आउटपुट टोकन 10,439 21,144
रीजनिंग टोकन 2,198 0
प्रतिक्रिया समय (औसत) 4.48s 6.82s
प्रतिक्रिया समय (अधिकतम) 23.18s 38.52s
प्रतिक्रिया समय (कुल) 85.21s 136.34s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 1,807 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 14.79s 6,210 1,114
GPT-5.2 Chat 8.2 6.7 83.3% 1 8.05s 4,131 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 980 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 7,810 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 335 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
GPT-5.2 Chat 9.8 10.0 100.0% 0 5.51s 1,441 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.43s 370 0
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.10s 1,603 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 3.0 10.0 0.0% 0 2.25s 24 0
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 1,239 0

त्वरित तुलना

तुलना जोड़ी बदलें