AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs MoonshotAI: Kimi K2.6

Rezumat

Kimi K2.6 conduce la scorul mediu cu 5.8 vs 5.0. DeepSeek V3.2 are costul de benchmark mai mic, $0.054 vs $0.233. DeepSeek V3.2 este mai rapid cu 18.25s vs 19.58s, cu rate de reușită de 37.9% vs 34.9%.

Model recomandatKimi K2.6Are cel mai puternic scor din această comparație (5.8) și cel mai bun echilibru între cost și timp de răspuns dintre toate cele 2 modele.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-17

Metrică	DeepSeek V3.2 DeepSeek V3.2 none Lansare: 2025-12-01	Kimi K2.6 Kimi K2.6 none Lansare: 2026-04-20

Metrică	DeepSeek V3.2 DeepSeek V3.2 none Lansare: 2025-12-01	Kimi K2.6 Kimi K2.6 none Lansare: 2026-04-20
Scor	5.0	5.8
Rang	#165	#131
Fiabilitate	10.0	10.0
Consistență	7.7	9.3
Teste corecte
Rată de trecere pe încercare	37.9%	34.9%
Teste instabile	6	2
Rulări totale	66	66
Cost per rezultat	0.870	3.199
Cost total	$0.054	$0.233
Preț de intrare	$0.269 / 1M	$0.950 / 1M
Preț de ieșire	$0.400 / 1M	$4.000 / 1M
Total tokenuri de intrare	135,780	116,970
Tokenuri de ieșire	42,097	30,253
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	18.25s	19.58s
Timp de răspuns (maxim)	115.89s	238.89s
Timp de răspuns (total)	401.60s	430.85s

Prezentare generare

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#165 DeepSeek V3.2

none

Cost: $0.002
Timp: 7.0s
Tokenuri: 1,046 tok

#131 MoonshotAI: Kimi K2.6

none

Cost: $0.020
Timp: 127.4s
Tokenuri: 4,429 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	3.2	8.0	8.3%	1		9.35s	494	1,073	0
Kimi K2.6	4.6	10.0	25.0%	0		1.39s	618	471	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	3.1	6.9	11.1%	1		14.54s	7,279	4,528	0
Kimi K2.6	5.5	9.8	33.3%	0		82.57s	5,986	14,754	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	4.8	10.0	0.0%	0		113.53s	109,626	33,819	0
Kimi K2.6	3.0	10.0	0.0%	0		77.83s	95,323	14,133	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	7,890	1,710	0
Kimi K2.6	10.0	10.0	100.0%	0		1.32s	7,014	201	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	2.9	7.2	11.1%	1		4.17s	624	21	0
Kimi K2.6	5.3	7.2	44.4%	1		1.48s	732	42	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	4.7	1.6	66.7%	1		9.32s	314	43	0
Kimi K2.6	5.4	3.5	33.3%	1		1.55s	477	138	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	627	66	0
Kimi K2.6	6.5	10.0	50.0%	0		1.64s	669	72	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	7.6	7.2	77.8%	1		6.91s	424	298	0
Kimi K2.6	3.1	9.9	0.0%	0		1.40s	651	185	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	8,319	522	0
Kimi K2.6	10.0	10.0	100.0%	0		4.46s	5,286	240	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	183	17	0
Kimi K2.6	3.0	10.0	0.0%	0		1.36s	214	17	0

Comparație rapidă

Schimbă perechea de comparație

DeepSeek V3.2nonevsMiniMax M2.7medium North Mini CodemediumDisponibil gratuitvsKimi K2.6none Kimi K2.6nonevsNemotron 3 SupermediumDisponibil gratuit DeepSeek V3.2nonevsMistral Small 4medium KAT-Coder-Air V2.5highvsKimi K2.6none Kimi K2.6nonevsStep 3.5 Flashmedium KAT-Coder-Air V2.5mediumvsKimi K2.6none Kimi K2.6nonevsGPT-5 Nanomedium DeepSeek V3.2nonevsQwen3 Coder Nextmedium Kimi K2.6nonevsgpt-oss-120bmedium CobuddymediumvsDeepSeek V3.2none Gemini 3.1 Flash LiteminimalvsKimi K2.6none