نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs OpenAI: GPT-5.4 Mini

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-04

میٹرک Kimi K2.5 Kimi K2.5 medium اجرا: 2026-01-27 GPT-5.4 Mini GPT-5.4 Mini medium اجرا: 2026-03-17
اسکور 7.2 7.1
درجہ #40 #42
تسلسل 7.2 7.2
درست ٹیسٹس
فی کوشش کامیابی کی شرح 72.6% 68.6%
غیر مستحکم ٹیسٹ 6 6
کل رنز 51 51
فی نتیجہ لاگت 2.232 3.610
کل لاگت $0.201 $0.289
?? ?? ???? $0.383 / 1M $0.750 / 1M
??? ?? ???? $1.720 / 1M $4.500 / 1M
آؤٹ پٹ ٹوکنز 40,907 1,708
ریزننگ ٹوکنز 75,121 58,019
ردِعمل کا وقت (اوسط) 64.59s 15.66s
ردِعمل کا وقت (زیادہ سے زیادہ) 137.29s 102.91s
ردِعمل کا وقت (کل) 645.93s 266.14s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 2,789 8,880
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 296 2,876
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 317 4,317
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 563 7,940
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 234 650
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 20,753 30,564
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 60 43,286
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 3,815 4,262
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 150 510
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
GPT-5.4 Mini 7.4 6.5 66.7% 1 2.50s 129 1,337
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 5.3 7.3 44.4% 1 45.40s 6,671 12,403
GPT-5.4 Mini 6.8 7.9 55.6% 1 4.33s 271 2,449
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 251 2,594

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں