AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs MoonshotAI: Kimi K2.5

Résumé

Comparaison benchmark DeepSeek V4 Pro vs Kimi K2.5 : DeepSeek V4 Pro mène au score moyen avec 6.3 vs 5.5. Kimi K2.5 a le coût de benchmark le plus bas avec $0.028 vs $0.079. Kimi K2.5 est plus rapide avec 13.18s vs 65.21s, avec des taux de réussite de 52.4% vs 34.9%.

Modèle recommandé: Kimi K2.5 - Son score reste proche du meilleur score ici (5.5 vs 6.3) tout en coûtant environ 2.9x moins que DeepSeek V4 Pro.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-12

Métrique	DeepSeek V4 Pro DeepSeek V4 Pro high Sortie: 2026-04-24	Kimi K2.5 Kimi K2.5 none Sortie: 2026-01-27

Métrique	DeepSeek V4 Pro DeepSeek V4 Pro high Sortie: 2026-04-24	Kimi K2.5 Kimi K2.5 none Sortie: 2026-01-27
Score	6.3	5.5
Rang	#90	#121
Fiabilité	9.0	10.0
Cohérence	7.6	8.9
Tests corrects
Taux de réussite par tentative	52.4%	34.9%
Tests instables	6	3
Exécutions totales	63	63
Coût par résultat	2.869	0.442
Coût total	$0.079	$0.028
Prix d'entrée	$0.435 / 1M	$0.400 / 1M
Prix de sortie	$0.870 / 1M	$1.900 / 1M
Total des jetons d'entrée	32,240	36,034
Jetons de sortie	12,250	6,657
Jetons de raisonnement	72,257	0
Temps de réponse (moy.)	65.21s	13.18s
Temps de réponse (max)	358.35s	42.13s
Temps de réponse (total)	1304.19s	184.47s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#90 DeepSeek V4 Pro

high

Cost: $0.023
Time: 257.6s
Tokens: 14,870 tok

#121 MoonshotAI: Kimi K2.5

none

Cost: $0.015
Time: 89.1s
Tokens: 5,421 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	6.4	7.9	58.3%	1		16.53s	448	71	3,617
Kimi K2.5	3.6	8.4	8.3%	1		6.24s	652	373	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	3.3	6.4	11.1%	1		118.23s	1,966	111	20,940
Kimi K2.5	5.5	10.0	33.3%	0		24.56s	7,311	4,708	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	10.0	10.0	100.0%	0		65.02s	14,016	465	5,914
Kimi K2.5	2.8	2.1	33.3%	1		19.16s	12,264	748	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	7.3	5.9	83.3%	1		23.62s	5,633	229	1,710
Kimi K2.5	7.3	5.8	83.3%	1		42.13s	7,180	187	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	2.9	7.2	11.1%	1		205.66s	430	10,529	28,089
Kimi K2.5	5.3	10.0	33.3%	0		4.38s	753	29	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	6.1	3.1	66.7%	1		25.09s	314	76	1,152
Kimi K2.5	10.0	10.0	100.0%	0		4.00s	483	76	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	10.0	10.0	100.0%	0		41.16s	627	205	2,416
Kimi K2.5	6.5	10.0	50.0%	0		2.67s	677	60	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	5.9	7.2	55.6%	1		34.84s	544	139	4,019
Kimi K2.5	3.0	10.0	0.0%	0		4.04s	667	236	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	10.0	10.0	100.0%	0		21.33s	8,079	372	593
Kimi K2.5	10.0	10.0	100.0%	0		13.99s	5,835	220	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	3.0	10.0	0.0%	0		39.14s	183	53	3,807
Kimi K2.5	3.0	10.0	0.0%	0		3.90s	212	20	0

Comparaison rapide

Changer la paire de comparaison

DeepSeek V4 ProhighvsGPT-5.5none DeepSeek V4 ProhighvsQwen3.5-35B-A3Bmedium DeepSeek V4 ProhighvsGemma 4 31BmediumDisponible gratuitement DeepSeek V4 ProhighvsNemotron 3 SupermediumDisponible gratuitement Seed-2.0-LitenonevsDeepSeek V4 Prohigh DeepSeek V4 ProhighvsGemini 2.5 Flashnone DeepSeek V4 ProhighvsGemini 3.1 Flash Liteminimal DeepSeek V4 ProhighvsGemini 3.1 Flash Litenone DeepSeek V4 ProhighvsGemini 3.1 Flash Litelow DeepSeek V4 ProhighvsQwen3.5-Flashnone DeepSeek V4 ProhighvsGemini 3.1 Flash Lite Previewnone DeepSeek V4 ProhighvsGemma 4 31BnoneDisponible gratuitement