نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs OpenAI: GPT-5.2 Chat

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-28

میٹرک Claude Opus 4.8 Claude Opus 4.8 medium اجرا: 2026-05-28 GPT-5.2 Chat GPT-5.2 Chat none اجرا: 2025-12-11
اسکور 8.7 7.9
درجہ #12 #31
اعتماد پذیری 10.0 10.0
تسلسل 9.6 8.9
درست ٹیسٹس
فی کوشش کامیابی کی شرح 83.3% 73.3%
غیر مستحکم ٹیسٹ 1 3
کل رنز 60 60
فی نتیجہ لاگت 6.285 2.703
کل لاگت $1.006 $0.352
ان پٹ قیمت $5.000 / 1M $1.750 / 1M
آؤٹ پٹ قیمت $25.000 / 1M $14.000 / 1M
آؤٹ پٹ ٹوکنز 23,201 21,144
ریزننگ ٹوکنز 5,901 0
ردِعمل کا وقت (اوسط) 9.34s 6.82s
ردِعمل کا وقت (زیادہ سے زیادہ) 38.03s 38.52s
ردِعمل کا وقت (کل) 186.84s 136.34s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 1,179 478
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 1,807 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 14.97s 6,651 1,381
GPT-5.2 Chat 8.2 6.7 83.3% 1 8.05s 4,131 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 5,260 1,588
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 481 312
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 980 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 7,477 900
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 7,810 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 237 0
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 335 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 373 320
GPT-5.2 Chat 9.8 10.0 100.0% 0 5.51s 1,441 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 791 483
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.10s 1,603 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 301 225
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 451 214
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 1,239 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں