नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Sonnet 5 vs OpenAI: GPT-5.2 Chat

सारांश

Claude Sonnet 5 vs GPT-5.2 Chat benchmark तुलना: GPT-5.2 Chat average score में आगे है: 8.5 vs 7.9. GPT-5.2 Chat की benchmark लागत कम है: $0.393 vs $0.550. GPT-5.2 Chat तेज है: 7.13s vs 9.94s, pass rates 79.4% vs 74.6%.

अनुशंसित मॉडल: GPT-5.2 Chat - It has the strongest score in this comparison (8.5) and the best overall balance of cost and response time across all 2 models.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-30

मेट्रिक Claude Sonnet 5 Claude Sonnet 5 medium रिलीज़: 2026-06-30 GPT-5.2 Chat GPT-5.2 Chat none रिलीज़: 2025-12-11
स्कोर 7.9 8.5
रैंक #30 #19
विश्वसनीयता 10.0 10.0
संगति 9.0 8.9
सही परीक्षण
प्रति प्रयास पास दर 79.4% 74.6%
अस्थिर टेस्ट 3 3
कुल रन 63 63
प्रति परिणाम लागत 3.662 2.803
कुल लागत $0.550 $0.393
इनपुट कीमत $2.000 / 1M $1.750 / 1M
आउटपुट कीमत $10.000 / 1M $14.000 / 1M
कुल इनपुट टोकन 67,416 34,212
आउटपुट टोकन 34,012 23,744
रीजनिंग टोकन 7,673 0
प्रतिक्रिया समय (औसत) 9.94s 7.13s
प्रतिक्रिया समय (अधिकतम) 56.94s 38.52s
प्रतिक्रिया समय (कुल) 208.71s 149.69s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#30 Claude Sonnet 5

medium
लागत
$0.007
समय
6.4s
टोकन
832 tok

#19 GPT-5.2 Chat

none
लागत
$0.010
समय
15.3s
टोकन
797 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 10.0 10.0 100.0% 0 3.80s 834 1,220 446
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 606 1,807 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 9.0 7.9 88.9% 1 17.28s 10,590 13,153 2,379
GPT-5.2 Chat 8.8 7.8 88.9% 1 9.82s 7,305 6,731 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 4.5 2.1 66.7% 1 37.01s 29,394 4,848 2,170
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 11,019 1,243 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 10.0 10.0 100.0% 0 3.16s 10,503 312 0
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 7,140 980 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 7.7 10.0 66.7% 0 20.38s 975 12,140 1,994
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 723 7,810 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 4.8 3.2 33.3% 1 4.32s 708 264 0
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 477 335 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 9.9 10.0 100.0% 0 3.10s 909 318 269
GPT-5.2 Chat 9.8 10.0 100.0% 0 5.51s 660 1,441 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 7.7 10.0 66.7% 0 2.98s 894 407 121
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.10s 642 1,603 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 10.0 10.0 100.0% 0 10.70s 12,351 433 90
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 5,445 555 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 3.0 10.0 0.0% 0 7.06s 258 917 204
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 195 1,239 0

त्वरित तुलना

तुलना जोड़ी बदलें