نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs HY3 Preview

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-29

میٹرک Claude Opus 4.6 Claude Opus 4.6 medium اجرا: 2026-02-05 HY3 Preview HY3 Preview high اجرا: 2026-04-22 مفت دستیاب
اسکور 7.6 8.5
درجہ #49 #13
اعتماد پذیری دستیاب نہیں دستیاب نہیں
تسلسل 9.1 8.8
درست ٹیسٹس
فی کوشش کامیابی کی شرح 70.4% 81.5%
غیر مستحکم ٹیسٹ 2 3
کل رنز 54 50
فی نتیجہ لاگت 12.047 0.000
کل لاگت $1.446 $0.000
?? ?? ???? $5.000 / 1M $0.000 / 1M
??? ?? ???? $25.000 / 1M $0.000 / 1M
آؤٹ پٹ ٹوکنز 29,829 238,920
ریزننگ ٹوکنز 18,938 0
ردِعمل کا وقت (اوسط) 21.08s 55.19s
ردِعمل کا وقت (زیادہ سے زیادہ) 83.40s 149.94s
ردِعمل کا وقت (کل) 231.84s 938.23s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
HY3 Preview 10.0 10.0 100.0% 0 32.69s 26,550 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
HY3 Preview 10.0 10.0 100.0% 0 99.76s 38,167 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
HY3 Preview 10.0 10.0 100.0% 0 113.09s 31,319 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
HY3 Preview 6.5 10.0 50.0% 0 12.11s 4,323 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
HY3 Preview 5.3 7.2 44.4% 1 109.04s 87,559 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
HY3 Preview 10.0 10.0 100.0% 0 24.31s 5,490 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
HY3 Preview 8.5 6.8 83.3% 1 34.02s 13,331 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
HY3 Preview 9.0 7.9 88.9% 1 28.07s 21,811 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
HY3 Preview 10.0 10.0 100.0% 0 78.83s 10,370 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں