नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.2 Chat

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 medium रिलीज़: 2026-02-17 GPT-5.2 Chat GPT-5.2 Chat none रिलीज़: 2025-12-11
स्कोर 8.0 7.9
रैंक #26 #28
संगति 9.5 8.7
सही परीक्षण
प्रति प्रयास पास दर 74.1% 75.9%
अस्थिर टेस्ट 1 3
कुल रन 54 54
प्रति परिणाम लागत 8.930 2.424
कुल लागत $1.161 $0.291
???? ??? $3.000 / 1M $1.750 / 1M
????? ??? $15.000 / 1M $14.000 / 1M
आउटपुट टोकन 42,068 17,346
रीजनिंग टोकन 26,784 0
प्रतिक्रिया समय (औसत) 12.66s 6.84s
प्रतिक्रिया समय (अधिकतम) 46.35s 38.52s
प्रतिक्रिया समय (कुल) 126.62s 123.17s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.5 10.0 50.0% 0 2.98s 1,046 1,093
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 1,807 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 35.76s 6,894 2,097
GPT-5.2 Chat 10.0 10.0 100.0% 0 8.97s 1,345 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 46.35s 5,871 3,962
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 13.90s 649 742
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 980 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 2.9 7.2 11.1% 1 0ms 25,790 16,919
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 7,810 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.94s 256 433
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 335 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 2.61s 318 552
GPT-5.2 Chat 7.5 6.1 83.3% 1 5.46s 1,528 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.80s 589 635
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.42s 1,743 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 7.48s 655 351
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0

त्वरित तुलना

तुलना जोड़ी बदलें