نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

Inception: Mercury 2 vs Owl Alpha

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-30

میٹرک Mercury 2 Mercury 2 medium اجرا: 2026-02-24 Owl Alpha Owl Alpha none اجرا: 2026-04-30
اسکور 6.5 6.0
درجہ #71 #87
اعتماد پذیری دستیاب نہیں 10.0
تسلسل 8.6 9.1
درست ٹیسٹس
فی کوشش کامیابی کی شرح 53.7% 46.3%
غیر مستحکم ٹیسٹ 3 2
کل رنز 54 54
فی نتیجہ لاگت 0.580 0.000
کل لاگت $0.047 $0.000
?? ?? ???? $0.250 / 1M $0.000 / 1M
??? ?? ???? $0.750 / 1M $0.000 / 1M
آؤٹ پٹ ٹوکنز 3,972 1,671
ریزننگ ٹوکنز 48,333 0
ردِعمل کا وقت (اوسط) 2.21s 7.07s
ردِعمل کا وقت (زیادہ سے زیادہ) 14.63s 32.27s
ردِعمل کا وقت (کل) 37.51s 127.23s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
Owl Alpha 3.4 7.9 16.7% 1 2.78s 57 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.53s 249 2,213
Owl Alpha 10.0 10.0 100.0% 0 32.27s 450 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
Owl Alpha 3.0 10.0 0.0% 0 21.74s 315 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
Owl Alpha 10.0 10.0 100.0% 0 3.60s 246 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
Owl Alpha 5.3 10.0 33.3% 0 3.00s 27 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
Owl Alpha 4.3 10.0 0.0% 0 4.61s 80 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
Owl Alpha 6.4 10.0 50.0% 0 2.63s 63 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 3.9 7.5 22.2% 1 934ms 354 2,758
Owl Alpha 5.9 7.2 55.6% 1 4.43s 202 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
Owl Alpha 10.0 10.0 100.0% 0 22.78s 231 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں