#60

Kimi K2.7 Code

Moonshot AI रिलीज़: 2026-06-12 परीक्षण किया गया: 2026-07-16 22:20 moonshotai/kimi-k2.7-code::medium

सारांश

Kimi K2.7 Code AI BENCHY पर 7.5 स्कोर करता है और #60 पर है। इसकी reliability 10.0, pass rate 65.2%, कुल लागत $0.692, और औसत response time 84.25s है।

Kimi K2.7 Code को अलग क्या बनाता है: यह Samanya Buddhimatta में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि टूल कॉलिंग इसकी सबसे कमजोर जगह है, जहाँ यह #16 पर है।

स्कोर

7.5

संगति

8.3

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.692 ↓ -10.8%

परीक्षण के समय: $0.775

कुल आउटपुट टोकन

262,507

कुल इनपुट टोकन

72,073

इनपुट कीमत

$0.780 / 1M

आउटपुट कीमत

$3.500 / 1M

सही परीक्षण

गलत टेस्ट: 10

प्रति प्रयास पास दर: 65.2%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

84.25s

प्रतिक्रिया समय (अधिकतम): 365.80s

प्रतिक्रिया समय (कुल): 1769.22s

गलत उत्तर: 5 समय समाप्त: 3 API त्रुटि: 1 निर्देशों का पालन नहीं किया: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#60 MoonshotAI: Kimi K2.7 Code

medium

लागत: $0.025
समय: 138.0s
टोकन: 6,093 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	सही परीक्षण	कुल लागत	तुलना करें
2026-07-16 22:20 नया टेस्ट जोड़ा गया	7.5	10.0		$0.690 ↓	वर्तमान रन
2026-06-12 18:35 पहला रन	7.0	9.2		$0.669	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-12 18:36	$0.950 / 1M	$4.000 / 1M
2026-06-17 10:07	$0.740 / 1M	$3.500 / 1M
2026-07-09 20:59	$0.720 / 1M	$3.490 / 1M
2026-07-14 10:48	$0.719 / 1M	$3.490 / 1M
2026-07-16 15:36	$0.750 / 1M	$3.500 / 1M
2026-07-18 15:17	$1.000 / 1M	$4.400 / 1M
2026-07-20 15:56	$0.850 / 1M	$3.800 / 1M
2026-07-21 16:10	$0.820 / 1M	$3.750 / 1M
2026-07-25 03:22	$0.780 / 1M	$3.500 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Kimi K2.7 CodemediumvsClaude Opus 5none Kimi K2.7 CodemediumvsGPT-5.4 Nanomedium Kimi K2.7 CodemediumvsNemotron 3 Ultramediumनिःशुल्क उपलब्ध Kimi K2.7 CodemediumvsGPT-5.3 Chatnone Kimi K2.7 CodemediumvsGPT-5.6 Lunamedium Kimi K2.7 CodemediumvsGPT-5.6 Terralow Kimi K2.7 CodemediumvsGrok Build 0.1medium Kimi K2.7 CodemediumvsGPT-5.4 Minimedium Kimi K2.7 CodemediumvsMiniMax M3medium Kimi K2.7 CodemediumvsQwen3.5 Plus 2026-02-15medium

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	7.3	5.8
कोडिंग	7.8	9.3
संयुक्त	7.3	5.8
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.5	9.3
Samanya Buddhimatta	10.0	10.0
निर्देश पालन	9.9	10.0
पहेली समाधान	5.9	7.7
टूल कॉलिंग	3.0	10.0
सामान्य ज्ञान	3.0	10.0

Kimi K2.7 Code

Hamster playing table tennis

#60 MoonshotAI: Kimi K2.7 Code

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल