نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 5 vs OpenAI: GPT-5.2 Chat

خلاصہ

Claude Sonnet 5 vs GPT-5.2 Chat benchmark موازنہ: GPT-5.2 Chat average score میں آگے ہے: 8.5 vs 7.9. GPT-5.2 Chat کی benchmark لاگت کم ہے: $0.393 vs $0.550. GPT-5.2 Chat تیز ہے: 7.13s vs 9.94s، pass rates 79.4% vs 74.6%.

تجویز کردہ ماڈل: GPT-5.2 Chat - It has the strongest score in this comparison (8.5) and the best overall balance of cost and response time across all 2 models.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-30

میٹرک Claude Sonnet 5 Claude Sonnet 5 medium اجرا: 2026-06-30 GPT-5.2 Chat GPT-5.2 Chat none اجرا: 2025-12-11
اسکور 7.9 8.5
درجہ #30 #19
اعتماد پذیری 10.0 10.0
تسلسل 9.0 8.9
درست ٹیسٹس
فی کوشش کامیابی کی شرح 79.4% 74.6%
غیر مستحکم ٹیسٹ 3 3
کل رنز 63 63
فی نتیجہ لاگت 3.662 2.803
کل لاگت $0.550 $0.393
ان پٹ قیمت $2.000 / 1M $1.750 / 1M
آؤٹ پٹ قیمت $10.000 / 1M $14.000 / 1M
کل ان پٹ ٹوکنز 67,416 34,212
آؤٹ پٹ ٹوکنز 34,012 23,744
ریزننگ ٹوکنز 7,673 0
ردِعمل کا وقت (اوسط) 9.94s 7.13s
ردِعمل کا وقت (زیادہ سے زیادہ) 56.94s 38.52s
ردِعمل کا وقت (کل) 208.71s 149.69s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#30 Claude Sonnet 5

medium
لاگت
$0.007
وقت
6.4s
ٹوکنز
832 tok

#19 GPT-5.2 Chat

none
لاگت
$0.010
وقت
15.3s
ٹوکنز
797 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 10.0 10.0 100.0% 0 3.80s 834 1,220 446
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 606 1,807 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 9.0 7.9 88.9% 1 17.28s 10,590 13,153 2,379
GPT-5.2 Chat 8.8 7.8 88.9% 1 9.82s 7,305 6,731 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 4.5 2.1 66.7% 1 37.01s 29,394 4,848 2,170
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 11,019 1,243 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 10.0 10.0 100.0% 0 3.16s 10,503 312 0
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 7,140 980 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 7.7 10.0 66.7% 0 20.38s 975 12,140 1,994
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 723 7,810 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 4.8 3.2 33.3% 1 4.32s 708 264 0
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 477 335 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 9.9 10.0 100.0% 0 3.10s 909 318 269
GPT-5.2 Chat 9.8 10.0 100.0% 0 5.51s 660 1,441 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 7.7 10.0 66.7% 0 2.98s 894 407 121
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.10s 642 1,603 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 10.0 10.0 100.0% 0 10.70s 12,351 433 90
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 5,445 555 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 3.0 10.0 0.0% 0 7.06s 258 917 204
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 195 1,239 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں