DeepSeek V4 Pro (high) vs GPT-5.4 Nano (medium)

Recommended model GPT-5.4 Nano (medium)

Its score stays close to the best score here (7.5 vs 7.7), while responding about 6.0x faster than DeepSeek V4 Pro (high).

Detailed comparison

Metric	DeepSeek V4 Pro DeepSeek V4 Pro high Release: 2026-04-24	GPT-5.4 Nano GPT-5.4 Nano medium Release: 2026-03-17

Metric	DeepSeek V4 Pro DeepSeek V4 Pro high Release: 2026-04-24	GPT-5.4 Nano GPT-5.4 Nano medium Release: 2026-03-17
Score	7.7	7.5
Rank	#58	#66
Reliability	10.0	10.0
Consistency	7.7	8.5
Tests Correct
Attempt pass rate	63.6%	65.2%
Flaky tests	6	4
Total Runs	66	66
Cost per result	2.000	1.150
Total Cost	$0.200	$0.138
Input Price	$0.435 / 1M	$0.200 / 1M
Output Price	$0.870 / 1M	$1.250 / 1M
Total Input Tokens	90,748	82,819
Output Tokens	10,462	7,100
Reasoning Tokens	178,719	90,022
Response Time (avg)	79.14s	13.24s
Response Time (max)	416.76s	94.06s
Response Time (total)	1740.97s	291.33s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

high

medium

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	5.7	5.9	58.3%	2		25.70s	536	149	3,214
GPT-5.4 Nano	8.3	10.0	75.0%	0		4.52s	606	683	2,254

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	6.3	8.7	33.3%	0		243.00s	5,090	383	84,580
GPT-5.4 Nano	6.1	4.7	66.7%	2		19.12s	7,305	516	20,778

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	10.0	10.0	100.0%	0		78.99s	66,082	4,582	25,404
GPT-5.4 Nano	9.9	10.0	100.0%	0		32.24s	59,730	4,435	19,221

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	10.0	10.0	100.0%	0		25.03s	7,690	274	2,166
GPT-5.4 Nano	10.0	10.0	100.0%	0		2.54s	7,140	234	516

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	3.6	7.2	22.2%	1		151.46s	569	4,404	50,391
GPT-5.4 Nano	5.9	7.2	55.6%	1		38.18s	619	60	43,325

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	10.0	10.0	100.0%	0		8.83s	471	115	1,013
GPT-5.4 Nano	4.5	10.0	0.0%	0		4.15s	477	179	443

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	7.8	6.6	83.3%	1		8.73s	627	66	2,726
GPT-5.4 Nano	9.8	10.0	100.0%	0		1.88s	660	95	521

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	6.9	4.9	77.8%	2		56.85s	591	178	2,563
GPT-5.4 Nano	4.1	7.2	22.2%	1		3.79s	642	594	1,408

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	9.8	10.0	100.0%	0		15.92s	8,909	295	701
GPT-5.4 Nano	10.0	10.0	100.0%	0		7.71s	5,445	234	382

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	3.0	10.0	0.0%	0		34.01s	183	16	5,961
GPT-5.4 Nano	3.0	10.0	0.0%	0		4.81s	195	70	1,174

Switch Comparison Pair