نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs OpenAI: GPT-5.2

خلاصہ

Claude Opus 4.8 vs GPT-5.2 benchmark موازنہ: GPT-5.2 average score میں آگے ہے: 8.4 vs 7.7. GPT-5.2 کی benchmark لاگت کم ہے: $0.548 vs $1.270. Claude Opus 4.8 تیز ہے: 10.83s vs 16.88s، pass rates 79.4% vs 71.4%.

تجویز کردہ ماڈل: GPT-5.2 - It has the best score here (8.4), while costing about 2.3x less than Claude Opus 4.8.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-07-02

میٹرک Claude Opus 4.8 Claude Opus 4.8 low اجرا: 2026-05-28 GPT-5.2 GPT-5.2 medium اجرا: 2025-12-11
اسکور 7.7 8.4
درجہ #38 #22
اعتماد پذیری 10.0 10.0
تسلسل 8.8 8.4
درست ٹیسٹس
فی کوشش کامیابی کی شرح 79.4% 71.4%
غیر مستحکم ٹیسٹ 3 4
کل رنز 63 63
فی نتیجہ لاگت 8.466 4.209
کل لاگت $1.270 $0.548
ان پٹ قیمت $5.000 / 1M $1.750 / 1M
آؤٹ پٹ قیمت $25.000 / 1M $14.000 / 1M
کل ان پٹ ٹوکنز 60,946 33,967
آؤٹ پٹ ٹوکنز 31,771 2,901
ریزننگ ٹوکنز 6,831 31,932
ردِعمل کا وقت (اوسط) 10.83s 16.88s
ردِعمل کا وقت (زیادہ سے زیادہ) 127.97s 77.80s
ردِعمل کا وقت (کل) 227.39s 236.34s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#38 Claude Opus 4.8

low
لاگت
$0.031
وقت
14.1s
ٹوکنز
1,345 tok

#22 GPT-5.2

medium
لاگت
$0.047
وقت
49.2s
ٹوکنز
3,396 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.30s 834 793 371
GPT-5.2 6.5 8.0 58.3% 1 7.81s 606 567 2,002
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 6.6 4.6 77.8% 2 7.58s 10,590 3,637 809
GPT-5.2 10.0 10.0 100.0% 0 22.73s 7,302 511 11,912
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 9.8 10.0 100.0% 0 20.84s 23,500 2,216 1,081
GPT-5.2 10.0 10.0 100.0% 0 14.06s 11,019 291 1,757
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 6.3 5.8 66.7% 1 2.27s 10,503 310 0
GPT-5.2 10.0 10.0 100.0% 0 3.15s 7,140 234 420
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 5.3 10.0 33.3% 0 45.53s 975 23,311 3,908
GPT-5.2 5.9 7.2 55.6% 1 77.80s 473 42 10,342
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 2.55s 708 231 0
GPT-5.2 3.7 9.7 0.0% 0 4.32s 477 162 269
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 9.8 10.0 100.0% 0 2.78s 909 111 221
GPT-5.2 9.9 10.0 100.0% 0 3.12s 660 94 614
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.01s 894 592 184
GPT-5.2 7.5 7.3 77.8% 1 5.80s 642 735 924
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 6.85s 11,775 370 35
GPT-5.2 4.7 1.6 66.7% 1 10.30s 5,453 239 469
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 3.0 10.0 0.0% 0 5.48s 258 200 222
GPT-5.2 3.0 10.0 0.0% 0 28.18s 195 26 3,223

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں