AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs MoonshotAI: Kimi K2.7 Code

Résumé

Comparaison benchmark DeepSeek V4 Pro vs Kimi K2.7 Code : DeepSeek V4 Pro mène au score moyen avec 7.2 vs 7.0. DeepSeek V4 Pro a le coût de benchmark le plus bas avec $0.034 vs $0.583. DeepSeek V4 Pro est plus rapide avec 6.41s vs 83.60s, avec des taux de réussite de 52.4% vs 66.7%.

Modèle recommandé: DeepSeek V4 Pro - Il obtient le meilleur score ici (7.2) tout en coûtant environ 17.5x moins que Kimi K2.7 Code.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-18

Métrique	DeepSeek V4 Pro DeepSeek V4 Pro none Sortie: 2026-04-24	Kimi K2.7 Code Kimi K2.7 Code medium Sortie: 2026-06-12

Métrique	DeepSeek V4 Pro DeepSeek V4 Pro none Sortie: 2026-04-24	Kimi K2.7 Code Kimi K2.7 Code medium Sortie: 2026-06-12
Score	7.2	7.0
Rang	#58	#65
Fiabilité	9.9	9.2
Cohérence	8.8	7.7
Tests corrects
Taux de réussite par tentative	52.4%	66.7%
Tests instables	3	6
Exécutions totales	63	63
Coût par résultat	0.333	6.074
Coût total	$0.034	$0.583
Prix d'entrée	$0.435 / 1M	$0.740 / 1M
Prix de sortie	$0.870 / 1M	$3.500 / 1M
Total des jetons d'entrée	53,558	25,991
Jetons de sortie	11,424	80,516
Jetons de raisonnement	0	161,391
Temps de réponse (moy.)	6.41s	83.60s
Temps de réponse (max)	30.09s	365.80s
Temps de réponse (total)	134.66s	1671.99s

Génération showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#58 DeepSeek V4 Pro

none

SVG invalide

Coût: $0.000
Temps: 300.0s
Tokens: 0 tok

#65 MoonshotAI: Kimi K2.7 Code

medium

Coût: $0.025
Temps: 138.0s
Tokens: 6,093 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	3.2	6.1	16.7%	2		4.02s	540	1,168	0
Kimi K2.7 Code	7.3	5.8	83.3%	2		11.56s	618	3,048	5,041

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	5.6	10.0	33.3%	0		13.38s	7,275	5,500	0
Kimi K2.7 Code	7.6	7.2	77.8%	1		146.73s	4,650	1,864	25,635

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	9.5	10.0	100.0%	0		23.74s	27,529	2,235	0
Kimi K2.7 Code	4.7	1.6	66.7%	1		34.83s	11,271	444	3,906

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	10.0	10.0	100.0%	0		4.61s	7,568	200	0
Kimi K2.7 Code	10.0	10.0	100.0%	0		12.27s	7,014	248	2,569

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	5.3	10.0	33.3%	0		3.72s	666	24	0
Kimi K2.7 Code	5.3	7.2	44.4%	1		213.29s	431	55,572	63,639

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	5.0	10.0	0.0%	0		2.05s	471	126	0
Kimi K2.7 Code	10.0	10.0	100.0%	0		10.78s	477	1,024	1,071

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	6.3	5.8	66.7%	1		4.12s	627	713	0
Kimi K2.7 Code	9.9	10.0	100.0%	0		5.39s	669	725	1,232

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	10.0	10.0	100.0%	0		3.61s	594	442	0
Kimi K2.7 Code	5.9	7.7	44.4%	1		41.00s	651	15,438	17,368

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	10.0	10.0	100.0%	0		7.40s	8,105	328	0
Kimi K2.7 Code	3.0	10.0	0.0%	0		0ms	0	0	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	3.0	10.0	0.0%	0		5.76s	183	688	0
Kimi K2.7 Code	3.0	10.0	0.0%	0		341.76s	210	2,153	40,930

Comparaison rapide

Changer la paire de comparaison

DeepSeek V4 PrononevsGemma 4 26B A4BmediumDisponible gratuitement Gemini 3.5 FlashnonevsKimi K2.7 Codemedium Kimi K2.7 CodemediumvsStep 3.7 Flashhigh DeepSeek V4 PrononevsStep 3.7 Flashhigh DeepSeek V4 PrononevsGLM 5.1medium Gemini 3 Flash PreviewnonevsKimi K2.7 Codemedium Kimi K2.7 CodemediumvsGLM 5.2none Kimi K2.7 CodemediumvsQwen3.7 Maxnone Kimi K2.7 CodemediumvsQwen3.7 Plusnone DeepSeek V4 PrononevsGrok 4.20medium Gemini 3.5 FlashminimalvsKimi K2.7 Codemedium DeepSeek V4 PrononevsGemini 3 Flash Previewlow