AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs MoonshotAI: Kimi K2.7 Code

Rezumat

Comparație benchmark DeepSeek V4 Pro vs Kimi K2.7 Code: DeepSeek V4 Pro conduce la scorul mediu cu 7.2 vs 7.0. DeepSeek V4 Pro are costul de benchmark mai mic, $0.034 vs $0.583. DeepSeek V4 Pro este mai rapid cu 6.41s vs 83.60s, cu rate de reușită de 52.4% vs 66.7%.

Model recomandat: DeepSeek V4 Pro - Are cel mai bun scor aici (7.2) și costă de aproximativ 17.5x mai puțin decât Kimi K2.7 Code.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-18

Metrică	DeepSeek V4 Pro DeepSeek V4 Pro none Lansare: 2026-04-24	Kimi K2.7 Code Kimi K2.7 Code medium Lansare: 2026-06-12

Metrică	DeepSeek V4 Pro DeepSeek V4 Pro none Lansare: 2026-04-24	Kimi K2.7 Code Kimi K2.7 Code medium Lansare: 2026-06-12
Scor	7.2	7.0
Rang	#58	#65
Fiabilitate	9.9	9.2
Consistență	8.8	7.7
Teste corecte
Rată de trecere pe încercare	52.4%	66.7%
Teste instabile	3	6
Rulări totale	63	63
Cost per rezultat	0.333	6.074
Cost total	$0.034	$0.583
Preț de intrare	$0.435 / 1M	$0.740 / 1M
Preț de ieșire	$0.870 / 1M	$3.500 / 1M
Total tokenuri de intrare	53,558	25,991
Tokenuri de ieșire	11,424	80,516
Tokenuri de raționament	0	161,391
Timp de răspuns (mediu)	6.41s	83.60s
Timp de răspuns (maxim)	30.09s	365.80s
Timp de răspuns (total)	134.66s	1671.99s

Prezentare generare

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#58 DeepSeek V4 Pro

none

SVG invalid

Cost: $0.000
Timp: 300.0s
Tokenuri: 0 tok

#65 MoonshotAI: Kimi K2.7 Code

medium

Cost: $0.025
Timp: 138.0s
Tokenuri: 6,093 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	3.2	6.1	16.7%	2		4.02s	540	1,168	0
Kimi K2.7 Code	7.3	5.8	83.3%	2		11.56s	618	3,048	5,041

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	5.6	10.0	33.3%	0		13.38s	7,275	5,500	0
Kimi K2.7 Code	7.6	7.2	77.8%	1		146.73s	4,650	1,864	25,635

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	9.5	10.0	100.0%	0		23.74s	27,529	2,235	0
Kimi K2.7 Code	4.7	1.6	66.7%	1		34.83s	11,271	444	3,906

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	10.0	10.0	100.0%	0		4.61s	7,568	200	0
Kimi K2.7 Code	10.0	10.0	100.0%	0		12.27s	7,014	248	2,569

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	5.3	10.0	33.3%	0		3.72s	666	24	0
Kimi K2.7 Code	5.3	7.2	44.4%	1		213.29s	431	55,572	63,639

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	5.0	10.0	0.0%	0		2.05s	471	126	0
Kimi K2.7 Code	10.0	10.0	100.0%	0		10.78s	477	1,024	1,071

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	6.3	5.8	66.7%	1		4.12s	627	713	0
Kimi K2.7 Code	9.9	10.0	100.0%	0		5.39s	669	725	1,232

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	10.0	10.0	100.0%	0		3.61s	594	442	0
Kimi K2.7 Code	5.9	7.7	44.4%	1		41.00s	651	15,438	17,368

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	10.0	10.0	100.0%	0		7.40s	8,105	328	0
Kimi K2.7 Code	3.0	10.0	0.0%	0		0ms	0	0	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	3.0	10.0	0.0%	0		5.76s	183	688	0
Kimi K2.7 Code	3.0	10.0	0.0%	0		341.76s	210	2,153	40,930

Comparație rapidă

Schimbă perechea de comparație

DeepSeek V4 PrononevsGemma 4 26B A4BmediumDisponibil gratuit Gemini 3.5 FlashnonevsKimi K2.7 Codemedium Kimi K2.7 CodemediumvsStep 3.7 Flashhigh DeepSeek V4 PrononevsStep 3.7 Flashhigh DeepSeek V4 PrononevsGLM 5.1medium Gemini 3 Flash PreviewnonevsKimi K2.7 Codemedium Kimi K2.7 CodemediumvsGLM 5.2none Kimi K2.7 CodemediumvsQwen3.7 Maxnone Kimi K2.7 CodemediumvsQwen3.7 Plusnone DeepSeek V4 PrononevsGrok 4.20medium Gemini 3.5 FlashminimalvsKimi K2.7 Codemedium DeepSeek V4 PrononevsGemini 3 Flash Previewlow