#136

Kimi K2.5

Moonshot AI रिलीज़: 2026-01-27 परीक्षण किया गया: 2026-06-04 13:32 moonshotai/kimi-k2.5::none

(medium) (none)

सारांश

Kimi K2.5 AI BENCHY पर 5.5 स्कोर करता है और #136 पर है। इसकी reliability 10.0, pass rate 34.9%, कुल लागत $0.027, और औसत response time 13.18s है।

Kimi K2.5 को अलग क्या बनाता है: यह Samanya Buddhimatta में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि डेटा पार्सिंग और निष्कर्षण इसकी सबसे कमजोर जगह है, जहाँ यह #12 पर है।

स्कोर

5.5

संगति

8.9

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.027 ↑ +1.8%

परीक्षण के समय: $0.027

कुल आउटपुट टोकन

6,657

कुल इनपुट टोकन

36,034

इनपुट कीमत

$0.375 / 1M

आउटपुट कीमत

$2.025 / 1M

सही परीक्षण

गलत टेस्ट: 15

प्रति प्रयास पास दर: 34.9%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

13.18s

प्रतिक्रिया समय (अधिकतम): 42.13s

प्रतिक्रिया समय (कुल): 184.47s

गलत उत्तर: 15

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#136 MoonshotAI: Kimi K2.5

none

लागत: $0.015
समय: 89.1s
टोकन: 5,421 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-06-04 13:32 नया टेस्ट जोड़ा गया	5.2	10.0	$0.028 ↑	वर्तमान रन
2026-05-22 00:03 सूट बदला गया	5.3	10.0	$0.026	तुलना करें
2026-04-20 17:48 पहला दर्ज रन	5.5	लागू नहीं	$0.017	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-06-04 13:32 · वर्तमान रन	5.5	8.9	10.0	6/21	3	6,657	36,034	$0.027	13.18s
2026-04-20 17:48 · पहला दर्ज रन	5.5	8.7	लागू नहीं	6/18	3	2,659	0	$0.017	13.37s
अंतर	0.0	+0.2		0	0	+3998	+36034	+$0.011	-191ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.400 / 1M	$1.900 / 1M
2026-06-17 10:07	$0.375 / 1M	$2.025 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Kimi K2.5nonevsNemotron 3 Ultra 550b A55bnoneनिःशुल्क उपलब्ध Kimi K2.5nonevsGPT-5.6 Terranone Kimi K2.5nonevsGemma 4 31Bnoneनिःशुल्क उपलब्ध Kimi K2.5nonevsGLM 5none Kimi K2.5nonevsQwen3.5-Flashnone Kimi K2.5nonevsQwen3.6 Flashnone Kimi K2.5nonevsGemini 3.5 Flashhigh Kimi K2.5nonevsGemini 3 Flash Previewmedium Kimi K2.5nonevsNemotron 3 Ultra 550b A55bmediumनिःशुल्क उपलब्ध Kimi K2.5nonevsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	3.6	8.4
कोडिंग	5.5	10.0
संयुक्त	2.8	2.1
डेटा पार्सिंग और निष्कर्षण	7.3	5.8
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	10.0	10.0
निर्देश पालन	6.5	10.0
पहेली समाधान	3.0	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Kimi K2.5

Hamster playing table tennis

#136 MoonshotAI: Kimi K2.5

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल