نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs MoonshotAI: Kimi K2.5

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-08

میٹرک Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite none اجرا: 2026-05-08 Kimi K2.5 Kimi K2.5 medium اجرا: 2026-01-27
اسکور 6.7 6.8
درجہ #73 #69
اعتماد پذیری 10.0 10.0
تسلسل 8.4 7.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 57.9% 68.4%
غیر مستحکم ٹیسٹ 4 7
کل رنز 57 57
فی نتیجہ لاگت 0.123 2.616
کل لاگت $0.012 $0.236
?? ?? ???? $0.250 / 1M $0.440 / 1M
??? ?? ???? $1.500 / 1M $2.000 / 1M
آؤٹ پٹ ٹوکنز 2,454 42,188
ریزننگ ٹوکنز 0 92,514
ردِعمل کا وقت (اوسط) 1.11s 73.39s
ردِعمل کا وقت (زیادہ سے زیادہ) 2.97s 150.77s
ردِعمل کا وقت (کل) 21.13s 880.65s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 7.5 8.4 66.7% 1 1.07s 639 0
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 2,789 8,880
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.59s 636 0
Kimi K2.5 4.7 1.6 66.7% 1 150.77s 1,269 9,749
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.73s 357 0
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 843ms 279 0
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 563 7,940
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 762ms 15 0
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 20,753 30,564
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 992ms 63 0
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 3,815 4,262
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 859ms 72 0
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 6.3 4.8 66.7% 2 720ms 150 0
Kimi K2.5 5.3 7.3 44.4% 1 45.40s 6,671 12,403
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.97s 234 0
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 733ms 9 0
Kimi K2.5 3.0 10.0 0.0% 0 83.95s 12 7,644

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں