DeepSeek: DeepSeek V4 Flash vs OpenAI: GPT-5.2 Chat

GPT-5.2 Chat mène au score moyen avec 8.0 vs 7.7. DeepSeek V4 Flash (high) a le coût de benchmark le plus bas avec $0.041 vs $0.604. GPT-5.2 Chat est plus rapide avec 7.65s vs 49.75s, avec des taux de réussite de 72.7% vs 74.2%.

Modèle recommandéDeepSeek V4 Flash (high)Son score reste proche du meilleur score ici (7.7 vs 8.0) tout en coûtant environ 15.0x moins que GPT-5.2 Chat.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-07-25

Métrique	DeepSeek V4 Flash DeepSeek V4 Flash high Sortie: 2026-04-24	GPT-5.2 Chat GPT-5.2 Chat none Sortie: 2025-12-11

Métrique	DeepSeek V4 Flash DeepSeek V4 Flash high Sortie: 2026-04-24	GPT-5.2 Chat GPT-5.2 Chat none Sortie: 2025-12-11
Score	7.7	8.0
Rang	#52	#37
Fiabilité	10.0	10.0
Cohérence	8.2	8.6
Tests corrects
Taux de réussite par tentative	72.7%	74.2%
Tests instables	5	4
Exécutions totales	66	66
Coût par résultat	0.402	4.308
Coût total	$0.041	$0.604
Prix d'entrée	$0.094 / 1M	$1.750 / 1M
Prix de sortie	$0.188 / 1M	$14.000 / 1M
Total des jetons d'entrée	108,392	101,248
Jetons de sortie	14,478	30,424
Jetons de raisonnement	153,687	0
Temps de réponse (moy.)	49.75s	7.65s
Temps de réponse (max)	218.13s	38.52s
Temps de réponse (total)	1094.41s	168.39s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#52 DeepSeek V4 Flash

high

Coût: $0.003
Temps: 93.1s
Tokens: 7,926 tok

#37 GPT-5.2 Chat

none

Coût: $0.010
Temps: 15.3s
Tokens: 797 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Catégorie:

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	540	140	7,770
GPT-5.2 Chat	8.7	7.9	91.7%	1		3.40s	606	1,807	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	7.8	10.0	66.7%	0		50.60s	7,279	395	34,862
GPT-5.2 Chat	8.8	7.8	88.9%	1		9.82s	7,305	6,731	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	6.4	5.8	66.7%	1		104.10s	82,663	4,633	37,533
GPT-5.2 Chat	7.3	5.8	83.3%	1		13.91s	78,055	7,923	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	7,290	201	1,179
GPT-5.2 Chat	10.0	10.0	100.0%	0		3.05s	7,140	980	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	666	27	59,249
GPT-5.2 Chat	5.3	10.0	33.3%	0		17.78s	723	7,810	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	471	79	632
GPT-5.2 Chat	4.4	3.0	33.3%	1		3.20s	477	335	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	627	63	1,622
GPT-5.2 Chat	9.8	10.0	100.0%	0		5.51s	660	1,441	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	8.2	7.2	88.9%	1		26.11s	594	196	1,767
GPT-5.2 Chat	7.7	10.0	66.7%	0		4.10s	642	1,603	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	8,079	228	542
GPT-5.2 Chat	10.0	10.0	100.0%	0		4.68s	5,445	555	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	3.0	10.0	0.0%	0		54.46s	183	8,516	8,531
GPT-5.2 Chat	3.0	10.0	0.0%	0		6.89s	195	1,239	0

Comparaison rapide

Changer la paire de comparaison

GPT-5.2 ChatnonevsStep 3.7 Flashmedium GPT-5.2 ChatnonevsInklinghigh Gemini 3.5 Flash-LitehighvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsGLM 5.2high Claude Opus 4.6mediumvsDeepSeek V4 Flashhigh Muse Spark 1.1highvsGPT-5.2 Chatnone DeepSeek V4 FlashhighvsGLM 5medium DeepSeek V4 FlashhighvsMiniMax M3medium DeepSeek V4 FlashhighvsGrok Build 0.1medium GPT-5.2 ChatnonevsInklingmedium Kimi K3maxvsGPT-5.2 Chatnone Claude Opus 4.8lowvsDeepSeek V4 Flashhigh