نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs OpenAI: GPT-5.3 Chat

خلاصہ

Claude Opus 4.8 vs GPT-5.3 Chat benchmark موازنہ: Claude Opus 4.8 average score میں آگے ہے: 8.8 vs 7.5. GPT-5.3 Chat کی benchmark لاگت کم ہے: $0.433 vs $1.107. GPT-5.3 Chat تیز ہے: 6.34s vs 9.66s، pass rates 84.1% vs 66.7%.

تجویز کردہ ماڈل: GPT-5.3 Chat - It offers the best overall trade-off: a competitive score (7.5), lower cost than Claude Opus 4.8, and balanced response time.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-18

میٹرک Claude Opus 4.8 Claude Opus 4.8 medium اجرا: 2026-05-28 GPT-5.3 Chat GPT-5.3 Chat none اجرا: 2026-03-03
اسکور 8.8 7.5
درجہ #12 #45
اعتماد پذیری 10.0 10.0
تسلسل 9.6 8.1
درست ٹیسٹس
فی کوشش کامیابی کی شرح 84.1% 66.7%
غیر مستحکم ٹیسٹ 1 5
کل رنز 63 63
فی نتیجہ لاگت 6.512 3.605
کل لاگت $1.107 $0.433
ان پٹ قیمت $5.000 / 1M $1.750 / 1M
آؤٹ پٹ قیمت $25.000 / 1M $14.000 / 1M
کل ان پٹ ٹوکنز 61,007 34,209
آؤٹ پٹ ٹوکنز 26,495 26,617
ریزننگ ٹوکنز 5,901 0
ردِعمل کا وقت (اوسط) 9.66s 6.34s
ردِعمل کا وقت (زیادہ سے زیادہ) 38.03s 18.33s
ردِعمل کا وقت (کل) 202.89s 133.13s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#12 Claude Opus 4.8

medium
لاگت
$0.057
وقت
23.1s
ٹوکنز
2,412 tok

#45 GPT-5.3 Chat

none
لاگت
$0.008
وقت
8.1s
ٹوکنز
634 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 834 1,179 478
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 606 3,167 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 15.33s 10,590 9,945 1,381
GPT-5.3 Chat 5.6 4.7 55.6% 2 10.52s 7,302 6,632 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 23,561 5,260 1,588
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 11,019 2,614 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 10,503 481 312
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 7,140 942 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 975 7,477 900
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 723 8,264 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 708 237 0
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 477 319 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 909 373 320
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 660 1,491 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 894 791 483
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 642 1,758 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 11,775 301 225
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 5,445 861 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 258 451 214
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 195 569 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں