نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs OpenAI: GPT-5.3-Codex

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-29

میٹرک Claude Opus 4.7 Claude Opus 4.7 medium اجرا: 2026-04-16 GPT-5.3-Codex GPT-5.3-Codex medium اجرا: 2026-02-05
اسکور 8.9 8.3
درجہ #7 #17
اعتماد پذیری 10.0 10.0
تسلسل 10.0 8.4
درست ٹیسٹس
فی کوشش کامیابی کی شرح 85.0% 81.7%
غیر مستحکم ٹیسٹ 0 4
کل رنز 60 60
فی نتیجہ لاگت 3.670 4.887
کل لاگت $0.624 $0.685
ان پٹ قیمت $5.000 / 1M $1.750 / 1M
آؤٹ پٹ قیمت $25.000 / 1M $14.000 / 1M
آؤٹ پٹ ٹوکنز 10,439 2,336
ریزننگ ٹوکنز 2,198 42,565
ردِعمل کا وقت (اوسط) 4.48s 15.95s
ردِعمل کا وقت (زیادہ سے زیادہ) 23.18s 100.93s
ردِعمل کا وقت (کل) 85.21s 319.08s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 14.79s 6,210 1,114
GPT-5.3-Codex 10.0 10.0 100.0% 0 18.45s 514 7,266
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 2.43s 370 0
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.05s 356 1,593
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 3.0 10.0 0.0% 0 2.25s 24 0
GPT-5.3-Codex 2.8 1.6 33.3% 1 14.43s 30 1,701

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں