DeepSeek: DeepSeek V3.2 vs MoonshotAI: Kimi K2.5

Kimi K2.5 conduce la scorul mediu cu 5.5 vs 5.0. DeepSeek V3.2 are costul de benchmark mai mic, $0.054 vs $0.127. DeepSeek V3.2 este mai rapid cu 18.25s vs 19.15s, cu rate de reușită de 37.9% vs 34.9%.

Model recomandatKimi K2.5Are cel mai puternic scor din această comparație (5.5) și cel mai bun echilibru între cost și timp de răspuns dintre toate cele 2 modele.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-17

Metrică	DeepSeek V3.2 DeepSeek V3.2 none Lansare: 2025-12-01	Kimi K2.5 Kimi K2.5 none Lansare: 2026-01-27

Metrică	DeepSeek V3.2 DeepSeek V3.2 none Lansare: 2025-12-01	Kimi K2.5 Kimi K2.5 none Lansare: 2026-01-27
Scor	5.0	5.5
Rang	#165	#148
Fiabilitate	10.0	10.0
Consistență	7.7	8.6
Teste corecte
Rată de trecere pe încercare	37.9%	34.9%
Teste instabile	6	4
Rulări totale	66	66
Cost per rezultat	0.870	1.898
Cost total	$0.054	$0.127
Preț de intrare	$0.269 / 1M	$0.571 / 1M
Preț de ieșire	$0.400 / 1M	$2.850 / 1M
Total tokenuri de intrare	135,780	89,322
Tokenuri de ieșire	42,097	26,638
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	18.25s	19.15s
Timp de răspuns (maxim)	115.89s	102.83s
Timp de răspuns (total)	401.60s	287.30s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#165 DeepSeek V3.2

none

Cost: $0.002
Timp: 7.0s
Tokenuri: 1,046 tok

#148 MoonshotAI: Kimi K2.5

none

Cost: $0.015
Timp: 89.1s
Tokenuri: 5,421 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	3.2	8.0	8.3%	1		9.35s	494	1,073	0
Kimi K2.5	3.6	8.4	8.3%	1		6.24s	652	373	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	3.1	6.9	11.1%	1		14.54s	7,279	4,528	0
Kimi K2.5	5.5	10.0	33.3%	0		24.56s	7,311	4,708	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	4.8	10.0	0.0%	0		113.53s	109,626	33,819	0
Kimi K2.5	2.8	1.8	33.3%	2		61.00s	65,552	20,729	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	7,890	1,710	0
Kimi K2.5	7.3	5.8	83.3%	1		42.13s	7,180	187	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	2.9	7.2	11.1%	1		4.17s	624	21	0
Kimi K2.5	5.3	10.0	33.3%	0		4.38s	753	29	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	4.7	1.6	66.7%	1		9.32s	314	43	0
Kimi K2.5	10.0	10.0	100.0%	0		4.00s	483	76	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	627	66	0
Kimi K2.5	6.5	10.0	50.0%	0		2.67s	677	60	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	7.6	7.2	77.8%	1		6.91s	424	298	0
Kimi K2.5	3.0	10.0	0.0%	0		4.04s	667	236	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	8,319	522	0
Kimi K2.5	10.0	10.0	100.0%	0		13.99s	5,835	220	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	183	17	0
Kimi K2.5	3.0	10.0	0.0%	0		3.90s	212	20	0

Comparație rapidă

Schimbă perechea de comparație

DeepSeek V3.2nonevsMiniMax M2.7medium KAT-Coder-Air V2.5mediumvsKimi K2.5none KAT-Coder-Air V2.5lowvsKimi K2.5none DeepSeek V3.2nonevsMistral Small 4medium KAT-Coder-Air V2.5highvsKimi K2.5none Kimi K2.5nonevsNemotron 3 SupermediumDisponibil gratuit DeepSeek V3.2nonevsQwen3 Coder Nextmedium CobuddymediumvsDeepSeek V3.2none North Mini CodemediumDisponibil gratuitvsKimi K2.5none Mistral Small 4mediumvsKimi K2.5none DeepSeek V3.2nonevsKAT-Coder-Air V2.5low DeepSeek V3.2nonevsMiniMax M2.5medium