#72

Kimi K2.5

Moonshot AI · रिलीज़: 2026-01-27 · moonshotai/kimi-k2.5::none

स्कोर

5.5

संगति

8.7

कुल लागत

$0.017

कुल आउटपुट टोकन

2,659

???? ???

$0.383 / 1M

????? ???

$1.720 / 1M

सही परीक्षण

गलत टेस्ट: 12

प्रति प्रयास पास दर: 40.7%

अस्थिर टेस्ट

3

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

13.37s

प्रतिक्रिया समय (अधिकतम): 42.13s

प्रतिक्रिया समय (कुल): 147.05s

गलत उत्तर: 12

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Kimi K2.5nonevsQwen3.5-122B-A10Bnone Kimi K2.5nonevsgpt-oss-120bmediumनिःशुल्क उपलब्ध Kimi K2.5nonevsMistral Small 4medium Kimi K2.5nonevsQwen3.5-27Bnone Kimi K2.5nonevsGLM 4.7 Flashnone Kimi K2.5nonevsGemini 3 Flash Previewmedium Kimi K2.5nonevsGemini 3.1 Pro Previewmedium Kimi K2.5nonevsQwen3.6 Plus Previewmediumनिःशुल्क उपलब्ध

श्रेणी विवरण

श्रेणी	स्कोर	संगति	सही परीक्षण
एंटी-एआई ट्रिक्स	3.6	8.4
कोडिंग	10.0	10.0
संयुक्त	2.8	2.1
डेटा पार्सिंग और निष्कर्षण	7.3	5.8
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	10.0	10.0
निर्देश पालन	6.5	10.0
पहेली समाधान	3.1	10.0
टूल कॉलिंग	10.0	10.0

तुलना किए गए मॉडल