نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs OpenAI: GPT-5.3 Chat

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-16

میٹرک Claude Opus 4.6 Claude Opus 4.6 medium اجرا: 2026-02-05 GPT-5.3 Chat GPT-5.3 Chat none اجرا: 2026-03-03
اسکور 7.6 7.7
درجہ #36 #35
تسلسل 9.1 8.6
درست ٹیسٹس
فی کوشش کامیابی کی شرح 70.4% 68.5%
غیر مستحکم ٹیسٹ 2 3
کل رنز 54 54
فی نتیجہ لاگت 12.047 3.082
کل لاگت $1.446 $0.340
?? ?? ???? $5.000 / 1M $1.750 / 1M
??? ?? ???? $25.000 / 1M $14.000 / 1M
آؤٹ پٹ ٹوکنز 29,829 20,784
ریزننگ ٹوکنز 18,938 0
ردِعمل کا وقت (اوسط) 21.08s 5.88s
ردِعمل کا وقت (زیادہ سے زیادہ) 83.40s 18.33s
ردِعمل کا وقت (کل) 231.84s 105.90s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
GPT-5.3 Chat 10.0 10.0 100.0% 0 9.32s 1,436 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
GPT-5.3 Chat 8.3 10.0 50.0% 0 3.29s 1,455 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں