نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs OpenAI: gpt-oss-120b

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-11

میٹرک Kimi K2.5 Kimi K2.5 medium اجرا: 2026-01-27 gpt-oss-120b gpt-oss-120b none اجرا: 2025-08-05 مفت دستیاب
اسکور 7.0 5.2
درجہ #43 #79
تسلسل 6.8 7.9
درست ٹیسٹس
فی کوشش کامیابی کی شرح 72.2% 38.9%
غیر مستحکم ٹیسٹ 7 5
کل رنز 54 54
فی نتیجہ لاگت 2.444 0.221
کل لاگت $0.220 $0.009
?? ?? ???? $0.383 / 1M $0.039 / 1M
??? ?? ???? $1.720 / 1M $0.190 / 1M
آؤٹ پٹ ٹوکنز 42,176 44,652
ریزننگ ٹوکنز 84,870 0
ردِعمل کا وقت (اوسط) 72.43s 11.96s
ردِعمل کا وقت (زیادہ سے زیادہ) 150.77s 68.97s
ردِعمل کا وقت (کل) 796.70s 179.34s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 2,789 8,880
gpt-oss-120b 6.6 8.0 58.3% 1 6.03s 4,867 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 4.7 1.6 66.7% 1 150.77s 1,269 9,749
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 563 7,940
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 20,753 30,564
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 3,815 4,262
gpt-oss-120b 4.6 10.0 0.0% 0 2.83s 586 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
gpt-oss-120b 8.4 6.9 83.3% 1 5.10s 1,982 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 5.3 7.3 44.4% 1 45.40s 6,671 12,403
gpt-oss-120b 4.5 4.8 44.5% 2 6.86s 3,904 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں