नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs StepFun: Step 3.7 Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-04

मेट्रिक Kimi K2.6 Kimi K2.6 medium प्रकाशन: 2026-04-20 मोफत उपलब्ध Step 3.7 Flash Step 3.7 Flash high प्रकाशन: 2026-05-29
स्कोअर 7.2 7.0
क्रमांक #60 #71
विश्वसनीयता 10.0 10.0
सुसंगतता 8.6 8.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 65.1% 63.5%
अस्थिर चाचण्या 3 4
एकूण रन 63 63
प्रति निकाल खर्च 8.358 10.434
एकूण खर्च $0.891 $1.148
इनपुट किंमत $0.684 / 1M $0.200 / 1M
आउटपुट किंमत $3.420 / 1M $1.150 / 1M
एकूण इनपुट टोकन्स 29,450 38,391
आउटपुट टोकन्स 102,923 991,355
रिझनिंग टोकन्स 254,094 0
प्रतिसाद वेळ (सरासरी) 71.67s 64.46s
प्रतिसाद वेळ (कमाल) 406.78s 364.99s
प्रतिसाद वेळ (एकूण) 1433.36s 1353.57s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.6 7.0 8.0 66.7% 1 11.59s 618 7,115 8,934
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.6 5.7 8.6 33.3% 0 214.42s 2,925 9,970 77,189
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.6 10.0 10.0 100.0% 0 40.96s 11,271 711 13,876
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.6 10.0 10.0 100.0% 0 20.38s 7,014 316 11,305
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.6 5.3 7.2 44.4% 1 202.38s 326 47,035 98,262
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.6 10.0 10.0 100.0% 0 17.83s 477 3,981 4,472
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.6 10.0 10.0 100.0% 0 12.53s 669 3,977 5,269
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.6 6.0 7.4 55.6% 1 25.06s 651 13,860 17,599
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.6 10.0 10.0 100.0% 0 8.92s 5,286 248 1,011
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.6 3.0 10.0 0.0% 0 130.27s 213 15,710 16,177
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

झटपट तुलना

तुलना जोडी बदला