AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs MoonshotAI: Kimi K2.5

Résumé

Comparaison benchmark DeepSeek V4 Pro vs Kimi K2.5 : Kimi K2.5 mène au score moyen avec 7.5 vs 7.2. DeepSeek V4 Pro a le coût de benchmark le plus bas avec $0.034 vs $0.348. DeepSeek V4 Pro est plus rapide avec 6.41s vs 98.43s, avec des taux de réussite de 52.4% vs 68.3%.

Modèle recommandé: DeepSeek V4 Pro - Son score reste proche du meilleur score ici (7.2 vs 7.5) tout en coûtant environ 10.5x moins que Kimi K2.5.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-07-02

Métrique	DeepSeek V4 Pro DeepSeek V4 Pro none Sortie: 2026-04-24	Kimi K2.5 Kimi K2.5 medium Sortie: 2026-01-27

Métrique	DeepSeek V4 Pro DeepSeek V4 Pro none Sortie: 2026-04-24	Kimi K2.5 Kimi K2.5 medium Sortie: 2026-01-27
Score	7.2	7.5
Rang	#60	#45
Fiabilité	9.9	10.0
Cohérence	8.8	6.9
Tests corrects
Taux de réussite par tentative	52.4%	68.3%
Tests instables	3	8
Exécutions totales	63	63
Coût par résultat	0.333	3.704
Coût total	$0.034	$0.348
Prix d'entrée	$0.435 / 1M	$0.375 / 1M
Prix de sortie	$0.870 / 1M	$2.025 / 1M
Total des jetons d'entrée	53,558	34,312
Jetons de sortie	11,424	48,379
Jetons de raisonnement	0	157,747
Temps de réponse (moy.)	6.41s	98.43s
Temps de réponse (max)	30.09s	281.00s
Temps de réponse (total)	134.66s	1378.03s

Génération showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#60 DeepSeek V4 Pro

none

SVG invalide

Coût: $0.000
Temps: 300.0s
Tokens: 0 tok

#45 MoonshotAI: Kimi K2.5

medium

Coût: $0.030
Temps: 58.6s
Tokens: 8,683 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	3.2	6.1	16.7%	2		4.02s	540	1,168	0
Kimi K2.5	7.3	5.8	83.3%	2		51.38s	634	2,789	8,880

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	5.6	10.0	33.3%	0		13.38s	7,275	5,500	0
Kimi K2.5	6.1	4.6	66.7%	2		217.49s	6,935	5,705	74,693

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	9.5	10.0	100.0%	0		23.74s	27,529	2,235	0
Kimi K2.5	10.0	10.0	100.0%	0		71.37s	11,280	703	3,713

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	10.0	10.0	100.0%	0		4.61s	7,568	200	0
Kimi K2.5	10.0	10.0	100.0%	0		49.78s	7,020	563	7,940

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	5.3	10.0	33.3%	0		3.72s	666	24	0
Kimi K2.5	3.5	4.4	33.3%	2		137.29s	485	20,753	30,564

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	5.0	10.0	0.0%	0		2.05s	471	126	0
Kimi K2.5	6.5	3.4	66.7%	1		69.73s	480	3,815	4,262

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	6.3	5.8	66.7%	1		4.12s	627	713	0
Kimi K2.5	10.0	10.0	100.0%	0		92.47s	675	5,371	6,547

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	10.0	10.0	100.0%	0		3.61s	594	442	0
Kimi K2.5	5.3	7.3	44.4%	1		43.23s	659	8,426	12,692

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	10.0	10.0	100.0%	0		7.40s	8,105	328	0
Kimi K2.5	10.0	10.0	100.0%	0		31.74s	5,933	242	812

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	3.0	10.0	0.0%	0		5.76s	183	688	0
Kimi K2.5	3.0	10.0	0.0%	0		83.95s	211	12	7,644

Comparaison rapide

Changer la paire de comparaison

DeepSeek V4 PrononevsGemma 4 26B A4BmediumDisponible gratuitement Kimi K2.5mediumvsGPT-5.3 Chatnone DeepSeek V4 ProhighvsKimi K2.5medium DeepSeek V4 PrononevsStep 3.7 Flashhigh DeepSeek V4 PrononevsGLM 5.1medium DeepSeek V4 PrononevsLaguna XS 2.1mediumDisponible gratuitement Kimi K2.5mediumvsStep 3.7 Flashlow DeepSeek V4 PrononevsKimi K2.7 Codemedium Gemini 3 Flash PreviewlowvsKimi K2.5medium DeepSeek V4 PrononevsGrok 4.20medium Claude Opus 4.8lowvsKimi K2.5medium DeepSeek V4 PrononevsGemini 3 Flash Previewlow