نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs MoonshotAI: Kimi K2.5

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-29

میٹرک Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium اجرا: 2026-02-19 Kimi K2.5 Kimi K2.5 none اجرا: 2026-01-27
اسکور 9.6 5.5
درجہ #2 #99
اعتماد پذیری دستیاب نہیں دستیاب نہیں
تسلسل 10.0 8.7
درست ٹیسٹس
فی کوشش کامیابی کی شرح 94.4% 40.7%
غیر مستحکم ٹیسٹ 0 3
کل رنز 54 54
فی نتیجہ لاگت 3.400 0.271
کل لاگت $0.578 $0.017
?? ?? ???? $2.000 / 1M $0.440 / 1M
??? ?? ???? $12.000 / 1M $2.000 / 1M
آؤٹ پٹ ٹوکنز 1,932 2,659
ریزننگ ٹوکنز 40,542 0
ردِعمل کا وقت (اوسط) 15.96s 13.37s
ردِعمل کا وقت (زیادہ سے زیادہ) 40.61s 42.13s
ردِعمل کا وقت (کل) 175.52s 147.05s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
Kimi K2.5 10.0 10.0 100.0% 0 38.78s 649 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
Kimi K2.5 3.1 10.0 0.0% 0 4.73s 317 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں