DeepSeek: DeepSeek V4 Flash vs OpenAI: GPT-5.2 Chat

GPT-5.2 Chat conduce la scorul mediu cu 8.0 vs 7.7. DeepSeek V4 Flash (high) are costul de benchmark mai mic, $0.041 vs $0.604. GPT-5.2 Chat este mai rapid cu 7.65s vs 49.75s, cu rate de reușită de 72.7% vs 74.2%.

Model recomandatDeepSeek V4 Flash (high)Scorul rămâne aproape de cel mai bun scor de aici (7.7 vs 8.0) și costă de aproximativ 15.0x mai puțin decât GPT-5.2 Chat.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-25

Metrică	DeepSeek V4 Flash DeepSeek V4 Flash high Lansare: 2026-04-24	GPT-5.2 Chat GPT-5.2 Chat none Lansare: 2025-12-11

Metrică	DeepSeek V4 Flash DeepSeek V4 Flash high Lansare: 2026-04-24	GPT-5.2 Chat GPT-5.2 Chat none Lansare: 2025-12-11
Scor	7.7	8.0
Rang	#52	#37
Fiabilitate	10.0	10.0
Consistență	8.2	8.6
Teste corecte
Rată de trecere pe încercare	72.7%	74.2%
Teste instabile	5	4
Rulări totale	66	66
Cost per rezultat	0.402	4.308
Cost total	$0.041	$0.604
Preț de intrare	$0.094 / 1M	$1.750 / 1M
Preț de ieșire	$0.188 / 1M	$14.000 / 1M
Total tokenuri de intrare	108,392	101,248
Tokenuri de ieșire	14,478	30,424
Tokenuri de raționament	153,687	0
Timp de răspuns (mediu)	49.75s	7.65s
Timp de răspuns (maxim)	218.13s	38.52s
Timp de răspuns (total)	1094.41s	168.39s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#52 DeepSeek V4 Flash

high

Cost: $0.003
Timp: 93.1s
Tokenuri: 7,926 tok

#37 GPT-5.2 Chat

none

Cost: $0.010
Timp: 15.3s
Tokenuri: 797 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	540	140	7,770
GPT-5.2 Chat	8.7	7.9	91.7%	1		3.40s	606	1,807	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	7.8	10.0	66.7%	0		50.60s	7,279	395	34,862
GPT-5.2 Chat	8.8	7.8	88.9%	1		9.82s	7,305	6,731	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	6.4	5.8	66.7%	1		104.10s	82,663	4,633	37,533
GPT-5.2 Chat	7.3	5.8	83.3%	1		13.91s	78,055	7,923	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	7,290	201	1,179
GPT-5.2 Chat	10.0	10.0	100.0%	0		3.05s	7,140	980	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	666	27	59,249
GPT-5.2 Chat	5.3	10.0	33.3%	0		17.78s	723	7,810	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	471	79	632
GPT-5.2 Chat	4.4	3.0	33.3%	1		3.20s	477	335	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	627	63	1,622
GPT-5.2 Chat	9.8	10.0	100.0%	0		5.51s	660	1,441	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	8.2	7.2	88.9%	1		26.11s	594	196	1,767
GPT-5.2 Chat	7.7	10.0	66.7%	0		4.10s	642	1,603	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	8,079	228	542
GPT-5.2 Chat	10.0	10.0	100.0%	0		4.68s	5,445	555	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	3.0	10.0	0.0%	0		54.46s	183	8,516	8,531
GPT-5.2 Chat	3.0	10.0	0.0%	0		6.89s	195	1,239	0

Comparație rapidă

Schimbă perechea de comparație

GPT-5.2 ChatnonevsStep 3.7 Flashmedium GPT-5.2 ChatnonevsInklinghigh Gemini 3.5 Flash-LitehighvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsGLM 5.2high Claude Opus 4.6mediumvsDeepSeek V4 Flashhigh Muse Spark 1.1highvsGPT-5.2 Chatnone DeepSeek V4 FlashhighvsGLM 5medium DeepSeek V4 FlashhighvsMiniMax M3medium DeepSeek V4 FlashhighvsGrok Build 0.1medium GPT-5.2 ChatnonevsInklingmedium Kimi K3maxvsGPT-5.2 Chatnone Claude Opus 4.8lowvsDeepSeek V4 Flashhigh