نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Inception: Mercury 2

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-16

میٹرک DeepSeek V3.2 DeepSeek V3.2 none اجرا: 2025-12-01 Mercury 2 Mercury 2 medium اجرا: 2026-02-24
اسکور 6.1 6.5
درجہ #63 #53
تسلسل 8.1 8.6
درست ٹیسٹس
فی کوشش کامیابی کی شرح 50.0% 53.7%
غیر مستحکم ٹیسٹ 4 3
کل رنز 54 54
فی نتیجہ لاگت 0.226 0.580
کل لاگت $0.016 $0.047
?? ?? ???? $0.260 / 1M $0.250 / 1M
??? ?? ???? $0.380 / 1M $0.750 / 1M
آؤٹ پٹ ٹوکنز 8,384 3,972
ریزننگ ٹوکنز 0 48,333
ردِعمل کا وقت (اوسط) 12.09s 2.21s
ردِعمل کا وقت (زیادہ سے زیادہ) 115.89s 14.63s
ردِعمل کا وقت (کل) 217.56s 37.51s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 3.2 9.8 0.0% 0 7.63s 1,419 0
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 2.4 1.3 33.3% 1 7.63s 553 0
Mercury 2 10.0 10.0 100.0% 0 1.53s 249 2,213
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 2,887 0
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 1,710 0
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 3.6 7.2 22.2% 1 1.61s 24 0
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 10.0 10.0 100.0% 0 2.86s 67 0
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 66 0
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 8.5 7.5 88.9% 1 7.37s 1,136 0
Mercury 2 3.9 7.5 22.2% 1 934ms 354 2,758
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 522 0
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں