نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs Laguna Xs.2

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-29

میٹرک Kimi K2.5 Kimi K2.5 none اجرا: 2026-01-27 Laguna Xs.2 Laguna Xs.2 medium اجرا: 2026-04-28 مفت دستیاب
اسکور 5.5 6.2
درجہ #99 #80
اعتماد پذیری دستیاب نہیں 10.0
تسلسل 8.7 6.9
درست ٹیسٹس
فی کوشش کامیابی کی شرح 40.7% 57.4%
غیر مستحکم ٹیسٹ 3 7
کل رنز 54 54
فی نتیجہ لاگت 0.271 0.000
کل لاگت $0.017 $0.000
?? ?? ???? $0.440 / 1M $0.000 / 1M
??? ?? ???? $2.000 / 1M $0.000 / 1M
آؤٹ پٹ ٹوکنز 2,659 58,141
ریزننگ ٹوکنز 0 0
ردِعمل کا وقت (اوسط) 13.37s 6.03s
ردِعمل کا وقت (زیادہ سے زیادہ) 42.13s 29.11s
ردِعمل کا وقت (کل) 147.05s 108.59s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
Laguna Xs.2 7.4 5.9 83.3% 2 2.60s 5,283 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 10.0 10.0 100.0% 0 38.78s 649 0
Laguna Xs.2 6.3 3.7 33.3% 1 14.36s 7,896 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
Laguna Xs.2 3.0 10.0 0.0% 0 15.92s 8,501 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
Laguna Xs.2 7.1 5.6 83.3% 1 9.34s 10,472 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
Laguna Xs.2 4.1 4.4 44.5% 2 11.12s 18,712 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
Laguna Xs.2 4.1 10.0 0.0% 0 2.76s 1,421 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
Laguna Xs.2 10.0 10.0 100.0% 0 1.68s 1,517 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 3.1 10.0 0.0% 0 4.73s 317 0
Laguna Xs.2 5.3 10.0 33.3% 0 2.12s 3,168 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0
Laguna Xs.2 4.7 1.6 66.7% 1 3.39s 1,171 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں