DeepSeek: DeepSeek V3.2 vs Xiaomi: MiMo-V2.5-Pro

MiMo-V2.5-Pro conduce la scorul mediu cu 5.5 vs 5.0. DeepSeek V3.2 are costul de benchmark mai mic, $0.054 vs $0.068. MiMo-V2.5-Pro este mai rapid cu 4.12s vs 18.25s, cu rate de reușită de 37.9% vs 37.9%.

Model recomandatMiMo-V2.5-ProAre cel mai bun scor aici (5.5) și răspunde de aproximativ 4.4x mai rapid decât DeepSeek V3.2.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-17

Metrică	DeepSeek V3.2 DeepSeek V3.2 none Lansare: 2025-12-01	MiMo-V2.5-Pro MiMo-V2.5-Pro none Lansare: 2026-04-22

Metrică	DeepSeek V3.2 DeepSeek V3.2 none Lansare: 2025-12-01	MiMo-V2.5-Pro MiMo-V2.5-Pro none Lansare: 2026-04-22
Scor	5.0	5.5
Rang	#165	#147
Fiabilitate	10.0	10.0
Consistență	7.7	8.6
Teste corecte
Rată de trecere pe încercare	37.9%	37.9%
Teste instabile	6	4
Rulări totale	66	66
Cost per rezultat	0.870	1.509
Cost total	$0.054	$0.068
Preț de intrare	$0.269 / 1M	$0.435 / 1M
Preț de ieșire	$0.400 / 1M	$0.870 / 1M
Total tokenuri de intrare	135,780	124,799
Tokenuri de ieșire	42,097	15,362
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	18.25s	4.12s
Timp de răspuns (maxim)	115.89s	53.13s
Timp de răspuns (total)	401.60s	90.55s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#165 DeepSeek V3.2

none

Cost: $0.002
Timp: 7.0s
Tokenuri: 1,046 tok

#147 MiMo-V2.5-Pro

none

Cost: $0.004
Timp: 46.4s
Tokenuri: 4,025 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	3.2	8.0	8.3%	1		9.35s	494	1,073	0
MiMo-V2.5-Pro	3.3	8.1	8.3%	1		2.67s	645	994	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	3.1	6.9	11.1%	1		14.54s	7,279	4,528	0
MiMo-V2.5-Pro	4.3	7.8	22.2%	1		1.41s	6,559	485	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	4.8	10.0	0.0%	0		113.53s	109,626	33,819	0
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		28.33s	98,770	12,915	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	7,890	1,710	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		1.32s	7,758	249	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	2.9	7.2	11.1%	1		4.17s	624	21	0
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		877ms	753	27	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	4.7	1.6	66.7%	1		9.32s	314	43	0
MiMo-V2.5-Pro	4.0	10.0	0.0%	0		2.58s	498	87	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	627	66	0
MiMo-V2.5-Pro	6.4	10.0	50.0%	0		1.03s	684	66	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	7.6	7.2	77.8%	1		6.91s	424	298	0
MiMo-V2.5-Pro	6.7	4.7	77.8%	2		1.30s	678	267	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	8,319	522	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.30s	8,238	258	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	183	17	0
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		1.89s	216	14	0

Comparație rapidă

Schimbă perechea de comparație

DeepSeek V3.2nonevsMiniMax M2.7medium KAT-Coder-Air V2.5mediumvsMiMo-V2.5-Pronone KAT-Coder-Air V2.5lowvsMiMo-V2.5-Pronone DeepSeek V3.2nonevsMistral Small 4medium KAT-Coder-Air V2.5highvsMiMo-V2.5-Pronone Nemotron 3 SupermediumDisponibil gratuitvsMiMo-V2.5-Pronone DeepSeek V3.2nonevsQwen3 Coder Nextmedium CobuddymediumvsDeepSeek V3.2none North Mini CodemediumDisponibil gratuitvsMiMo-V2.5-Pronone Mistral Small 4mediumvsMiMo-V2.5-Pronone DeepSeek V3.2nonevsKAT-Coder-Air V2.5low DeepSeek V3.2nonevsMiniMax M2.5medium