AI BENCHY तुलना

DeepSeek: DeepSeek V4 Pro vs MoonshotAI: Kimi K2.7 Code

सारांश

DeepSeek V4 Pro vs Kimi K2.7 Code benchmark तुलना: DeepSeek V4 Pro average score में आगे है: 7.2 vs 7.0. DeepSeek V4 Pro की benchmark लागत कम है: $0.034 vs $0.583. DeepSeek V4 Pro तेज है: 6.41s vs 83.60s, pass rates 52.4% vs 66.7%.

अनुशंसित मॉडल: DeepSeek V4 Pro - It has the best score here (7.2), while costing about 17.5x less than Kimi K2.7 Code.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक	DeepSeek V4 Pro DeepSeek V4 Pro none रिलीज़: 2026-04-24	Kimi K2.7 Code Kimi K2.7 Code medium रिलीज़: 2026-06-12

मेट्रिक	DeepSeek V4 Pro DeepSeek V4 Pro none रिलीज़: 2026-04-24	Kimi K2.7 Code Kimi K2.7 Code medium रिलीज़: 2026-06-12
स्कोर	7.2	7.0
रैंक	#58	#65
विश्वसनीयता	9.9	9.2
संगति	8.8	7.7
सही परीक्षण
प्रति प्रयास पास दर	52.4%	66.7%
अस्थिर टेस्ट	3	6
कुल रन	63	63
प्रति परिणाम लागत	0.333	6.074
कुल लागत	$0.034	$0.583
इनपुट कीमत	$0.435 / 1M	$0.740 / 1M
आउटपुट कीमत	$0.870 / 1M	$3.500 / 1M
कुल इनपुट टोकन	53,558	25,991
आउटपुट टोकन	11,424	80,516
रीजनिंग टोकन	0	161,391
प्रतिक्रिया समय (औसत)	6.41s	83.60s
प्रतिक्रिया समय (अधिकतम)	30.09s	365.80s
प्रतिक्रिया समय (कुल)	134.66s	1671.99s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#58 DeepSeek V4 Pro

none

अमान्य SVG

लागत: $0.000
समय: 300.0s
टोकन: 0 tok

#65 MoonshotAI: Kimi K2.7 Code

medium

लागत: $0.025
समय: 138.0s
टोकन: 6,093 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
DeepSeek V4 Pro	3.2	6.1	16.7%	2		4.02s	540	1,168	0
Kimi K2.7 Code	7.3	5.8	83.3%	2		11.56s	618	3,048	5,041

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
DeepSeek V4 Pro	5.6	10.0	33.3%	0		13.38s	7,275	5,500	0
Kimi K2.7 Code	7.6	7.2	77.8%	1		146.73s	4,650	1,864	25,635

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
DeepSeek V4 Pro	9.5	10.0	100.0%	0		23.74s	27,529	2,235	0
Kimi K2.7 Code	4.7	1.6	66.7%	1		34.83s	11,271	444	3,906

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
DeepSeek V4 Pro	10.0	10.0	100.0%	0		4.61s	7,568	200	0
Kimi K2.7 Code	10.0	10.0	100.0%	0		12.27s	7,014	248	2,569

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
DeepSeek V4 Pro	5.3	10.0	33.3%	0		3.72s	666	24	0
Kimi K2.7 Code	5.3	7.2	44.4%	1		213.29s	431	55,572	63,639

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
DeepSeek V4 Pro	5.0	10.0	0.0%	0		2.05s	471	126	0
Kimi K2.7 Code	10.0	10.0	100.0%	0		10.78s	477	1,024	1,071

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
DeepSeek V4 Pro	6.3	5.8	66.7%	1		4.12s	627	713	0
Kimi K2.7 Code	9.9	10.0	100.0%	0		5.39s	669	725	1,232

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
DeepSeek V4 Pro	10.0	10.0	100.0%	0		3.61s	594	442	0
Kimi K2.7 Code	5.9	7.7	44.4%	1		41.00s	651	15,438	17,368

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
DeepSeek V4 Pro	10.0	10.0	100.0%	0		7.40s	8,105	328	0
Kimi K2.7 Code	3.0	10.0	0.0%	0		0ms	0	0	0

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
DeepSeek V4 Pro	3.0	10.0	0.0%	0		5.76s	183	688	0
Kimi K2.7 Code	3.0	10.0	0.0%	0		341.76s	210	2,153	40,930

त्वरित तुलना

तुलना जोड़ी बदलें

DeepSeek V4 PrononevsGemma 4 26B A4Bmediumनिःशुल्क उपलब्ध Gemini 3.5 FlashnonevsKimi K2.7 Codemedium Kimi K2.7 CodemediumvsStep 3.7 Flashhigh DeepSeek V4 PrononevsStep 3.7 Flashhigh DeepSeek V4 PrononevsGLM 5.1medium Gemini 3 Flash PreviewnonevsKimi K2.7 Codemedium Kimi K2.7 CodemediumvsGLM 5.2none Kimi K2.7 CodemediumvsQwen3.7 Maxnone Kimi K2.7 CodemediumvsQwen3.7 Plusnone DeepSeek V4 PrononevsGrok 4.20medium Gemini 3.5 FlashminimalvsKimi K2.7 Codemedium DeepSeek V4 PrononevsGemini 3 Flash Previewlow