نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5 Mini

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-01

میٹرک Claude Sonnet 4.6 Claude Sonnet 4.6 none اجرا: 2026-02-17 GPT-5 Mini GPT-5 Mini medium اجرا: 2025-08-07
اسکور 7.0 7.2
درجہ #78 #73
اعتماد پذیری 10.0 10.0
تسلسل 9.7 9.1
درست ٹیسٹس
فی کوشش کامیابی کی شرح 58.3% 61.7%
غیر مستحکم ٹیسٹ 1 2
کل رنز 60 60
فی نتیجہ لاگت 2.782 1.348
کل لاگت $0.306 $0.149
ان پٹ قیمت $3.000 / 1M $0.250 / 1M
آؤٹ پٹ قیمت $15.000 / 1M $2.000 / 1M
آؤٹ پٹ ٹوکنز 9,450 6,723
ریزننگ ٹوکنز 0 63,082
ردِعمل کا وقت (اوسط) 5.27s 23.75s
ردِعمل کا وقت (زیادہ سے زیادہ) 23.84s 88.15s
ردِعمل کا وقت (کل) 68.50s 475.03s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 1,214 0
GPT-5 Mini 7.1 7.6 66.7% 1 13.86s 1,715 6,378
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 6.8 10.0 50.0% 0 6.73s 2,112 0
GPT-5 Mini 10.0 10.0 100.0% 0 30.74s 580 12,544
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 3,766 0
GPT-5 Mini 10.0 10.0 100.0% 0 88.15s 754 11,520
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 252 0
GPT-5 Mini 10.0 10.0 100.0% 0 12.58s 453 3,200
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 413 0
GPT-5 Mini 3.6 7.2 22.2% 1 44.63s 293 14,016
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 192 0
GPT-5 Mini 4.5 10.0 0.0% 0 13.50s 349 1,856
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 90 0
GPT-5 Mini 10.0 10.0 100.0% 0 11.59s 310 3,968
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 533 0
GPT-5 Mini 5.6 9.8 33.3% 0 15.20s 1,622 6,144
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
GPT-5 Mini 10.0 10.0 100.0% 0 18.64s 487 1,600
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 431 0
GPT-5 Mini 3.0 10.0 0.0% 0 9.99s 160 1,856

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں