AI BENCHY
Advertise here

#60

Kimi K2.6

Moonshot AI प्रकाशन: 2026-04-20 चाचणी तारीख: 2026-06-04 13:59 moonshotai/kimi-k2.6::medium
(medium) (none)

सुसंगतता

8.6

एकूण खर्च (सध्याची किंमत)

$0.891 ↓ -11.2%

या किमतीवर चाचणी केली: $1.003

एकूण आउटपुट टोकन्स

357,017

एकूण इनपुट टोकन्स

29,450

इनपुट किंमत

$0.684 / 1M

आउटपुट किंमत

$3.420 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 9

प्रति प्रयत्न पास दर: 65.1%

अस्थिर चाचण्या

3

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

71.67s

प्रतिसाद वेळ (कमाल): 406.78s

प्रतिसाद वेळ (एकूण): 1433.36s

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:59 नवीन चाचणी जोडली 7.2 7.8 $0.891 सध्याची रन
2026-05-22 00:14 सूट बदलला 7.4 8.3 $0.916 तुलना करा
2026-04-23 10:54 पहिली नोंदलेली रन 7.7 लागू नाही $0.722 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 13:59 · सध्याची रन7.28.610.012/213357,01729,450$1.00371.67s
2026-04-23 10:54 · पहिली नोंदलेली रन7.78.3लागू नाही11/184260,5730$0.72245.20s
फरक-0.5+0.3+1-1+96444+29450+$0.282+26469ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.684 / 1M $3.420 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 7.0 8.0
कोडिंग 5.7 8.6
संयुक्त 10.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 5.3 7.2
Samanya Buddhimatta 10.0 10.0
सूचनांचे पालन 10.0 10.0
कोडी सोडवणे 6.0 7.4
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स