#136

Kimi K2.5

Moonshot AI प्रकाशन: 2026-01-27 चाचणी तारीख: 2026-06-04 13:32 moonshotai/kimi-k2.5::none

(medium) (none)

सारांश

Kimi K2.5 AI BENCHY वर 5.5 स्कोर करते आणि #136 वर आहे. याची reliability 10.0, pass rate 34.9%, एकूण खर्च $0.027, आणि सरासरी response time 13.18s आहे.

Kimi K2.5 खास का आहे: हे Samanya Buddhimatta मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर डेटा पार्सिंग आणि निष्कर्षण हा सर्वात कमकुवत भाग आहे, rank #12.

स्कोअर

5.5

सुसंगतता

8.9

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.027 ↑ +1.8%

या किमतीवर चाचणी केली: $0.027

एकूण आउटपुट टोकन्स

6,657

एकूण इनपुट टोकन्स

36,034

इनपुट किंमत

$0.375 / 1M

आउटपुट किंमत

$2.025 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 15

प्रति प्रयत्न पास दर: 34.9%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

13.18s

प्रतिसाद वेळ (कमाल): 42.13s

प्रतिसाद वेळ (एकूण): 184.47s

चुकीचे उत्तर: 15

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#136 MoonshotAI: Kimi K2.5

none

खर्च: $0.015
वेळ: 89.1s
टोकन्स: 5,421 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:32 नवीन चाचणी जोडली	5.2	10.0	$0.028 ↑	सध्याची रन
2026-05-22 00:03 सूट बदलला	5.3	10.0	$0.026	तुलना करा
2026-04-20 17:48 पहिली नोंदलेली रन	5.5	लागू नाही	$0.017	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण इनपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-06-04 13:32 · सध्याची रन	5.5	8.9	10.0	6/21	3	6,657	36,034	$0.027	13.18s
2026-04-20 17:48 · पहिली नोंदलेली रन	5.5	8.7	लागू नाही	6/18	3	2,659	0	$0.017	13.37s
फरक	0.0	+0.2		0	0	+3998	+36034	+$0.011	-191ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख	इनपुट किंमत	आउटपुट किंमत
2026-06-04 15:40	$0.400 / 1M	$1.900 / 1M
2026-06-17 10:07	$0.375 / 1M	$2.025 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Kimi K2.5nonevsNemotron 3 Ultra 550b A55bnoneमोफत उपलब्ध Kimi K2.5nonevsGPT-5.6 Terranone Kimi K2.5nonevsGemma 4 31Bnoneमोफत उपलब्ध Kimi K2.5nonevsGLM 5none Kimi K2.5nonevsQwen3.5-Flashnone Kimi K2.5nonevsQwen3.6 Flashnone Kimi K2.5nonevsGemini 3.5 Flashhigh Kimi K2.5nonevsGemini 3 Flash Previewmedium Kimi K2.5nonevsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध Kimi K2.5nonevsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	3.6	8.4
कोडिंग	5.5	10.0
संयुक्त	2.8	2.1
डेटा पार्सिंग आणि निष्कर्षण	7.3	5.8
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	10.0	10.0
सूचनांचे पालन	6.5	10.0
कोडी सोडवणे	3.0	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Kimi K2.5

Hamster playing table tennis

#136 MoonshotAI: Kimi K2.5

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स