نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MoonshotAI: Kimi K2.7 Code vs StepFun: Step 3.7 Flash

خلاصہ

Kimi K2.7 Code vs Step 3.7 Flash benchmark موازنہ: Step 3.7 Flash average score میں آگے ہے: 7.1 vs 7.0. Kimi K2.7 Code کی benchmark لاگت کم ہے: $0.669 vs $1.148. Step 3.7 Flash تیز ہے: 64.46s vs 83.60s، pass rates 66.7% vs 63.5%.

تجویز کردہ ماڈل: Kimi K2.7 Code - Its score stays close to the best score here (7.0 vs 7.1), while costing about 1.7x less than Step 3.7 Flash.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-12

میٹرک Kimi K2.7 Code Kimi K2.7 Code medium اجرا: 2026-06-12 Step 3.7 Flash Step 3.7 Flash high اجرا: 2026-05-29
اسکور 7.0 7.1
درجہ #65 #63
اعتماد پذیری 9.2 10.0
تسلسل 7.7 8.2
درست ٹیسٹس
فی کوشش کامیابی کی شرح 66.7% 63.5%
غیر مستحکم ٹیسٹ 6 4
کل رنز 63 63
فی نتیجہ لاگت 6.074 10.434
کل لاگت $0.669 $1.148
ان پٹ قیمت $0.950 / 1M $0.200 / 1M
آؤٹ پٹ قیمت $4.000 / 1M $1.150 / 1M
کل ان پٹ ٹوکنز 25,991 38,391
آؤٹ پٹ ٹوکنز 80,516 991,355
ریزننگ ٹوکنز 161,391 0
ردِعمل کا وقت (اوسط) 83.60s 64.46s
ردِعمل کا وقت (زیادہ سے زیادہ) 365.80s 364.99s
ردِعمل کا وقت (کل) 1671.99s 1353.57s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#65 MoonshotAI: Kimi K2.7 Code

medium
Cost
$0.025
Time
138.0s
Tokens
6,093 tok

#63 Step 3.7 Flash

high
Cost
$0.007
Time
63.6s
Tokens
6,030 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.7 Code 7.3 5.8 83.3% 2 11.56s 618 3,048 5,041
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.7 Code 7.6 7.2 77.8% 1 146.73s 4,650 1,864 25,635
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.7 Code 4.7 1.6 66.7% 1 34.83s 11,271 444 3,906
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.7 Code 10.0 10.0 100.0% 0 12.27s 7,014 248 2,569
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.7 Code 5.3 7.2 44.4% 1 213.29s 431 55,572 63,639
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.7 Code 10.0 10.0 100.0% 0 10.78s 477 1,024 1,071
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.7 Code 9.9 10.0 100.0% 0 5.39s 669 725 1,232
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.7 Code 5.9 7.7 44.4% 1 41.00s 651 15,438 17,368
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.7 Code 3.0 10.0 0.0% 0 0ms 0 0 0
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Kimi K2.7 Code 3.0 10.0 0.0% 0 341.76s 210 2,153 40,930
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں