نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs MoonshotAI: Kimi K2.5

موازنہ کریں:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-05

میٹرک Inception: Mercury 2 medium اجرا: 2026-02-24 MoonshotAI: Kimi K2.5 none اجرا: 2026-01-27
درجہ #35 #48
اوسط اسکور 54 37
تسلسل 83 85
فی نتیجہ لاگت 0.622 0.359
کل لاگت $0.044 $0.015
ردِعمل کا وقت (اوسط) 2.47s 12.90s
ردِعمل کا وقت (زیادہ سے زیادہ) 14.63s 42.13s
ردِعمل کا وقت (کل) 34.56s 103.17s
درست ٹیسٹس
فی کوشش کامیابی کی شرح 57.8% 35.6%
غیر مستحکم ٹیسٹ 3 3
آؤٹ پٹ ٹوکنز 3,571 1,924
ریزننگ ٹوکنز 45,379 0

اسکور کے لحاظ سے سرفہرست ماڈلز

ردِعمل کا وقت (اوسط)

اسکور بمقابلہ کل لاگت

اوسط اسکور vs ردِعمل کا وقت (اوسط)

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Inception: Mercury 2 73 98 66.7% 0 1.30s 2,531 2,410
MoonshotAI: Kimi K2.5 27 79 11.1% 1 11.38s 363 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Inception: Mercury 2 100 100 100.0% 0 3.28s 268 4,887
MoonshotAI: Kimi K2.5 100 21 33.3% 1 19.16s 748 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Inception: Mercury 2 55 59 83.3% 1 1.11s 183 1,656
MoonshotAI: Kimi K2.5 54 58 83.3% 1 42.13s 187 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Inception: Mercury 2 100 72 11.1% 1 6.48s 41 30,754
MoonshotAI: Kimi K2.5 40 100 33.3% 0 4.38s 29 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Inception: Mercury 2 100 100 100.0% 0 1.07s 14 958
MoonshotAI: Kimi K2.5 55 100 50.0% 0 2.67s 60 0
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Inception: Mercury 2 17 75 22.2% 1 934ms 354 2,758
MoonshotAI: Kimi K2.5 100 100 0.0% 0 4.73s 317 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Inception: Mercury 2 100 100 100.0% 0 1.89s 180 1,956
MoonshotAI: Kimi K2.5 100 100 100.0% 0 13.99s 220 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں