DeepSeek V4 Pro (high) vs GPT-5.4 Mini (medium)

Recommended model DeepSeek V4 Pro (high)

It has the best score here (7.7), while costing about 3.8x less than GPT-5.4 Mini (medium).

Detailed comparison

Metric	DeepSeek V4 Pro DeepSeek V4 Pro high Release: 2026-04-24	GPT-5.4 Mini GPT-5.4 Mini medium Release: 2026-03-17

Metric	DeepSeek V4 Pro DeepSeek V4 Pro high Release: 2026-04-24	GPT-5.4 Mini GPT-5.4 Mini medium Release: 2026-03-17
Score	7.7	7.5
Rank	#58	#69
Reliability	10.0	10.0
Consistency	7.7	7.7
Tests Correct
Attempt pass rate	63.6%	71.2%
Flaky tests	6	6
Total Runs	66	66
Cost per result	2.000	6.299
Total Cost	$0.200	$0.756
Input Price	$0.435 / 1M	$0.750 / 1M
Output Price	$0.870 / 1M	$4.500 / 1M
Total Input Tokens	90,748	97,155
Output Tokens	10,462	6,211
Reasoning Tokens	178,719	145,544
Response Time (avg)	79.14s	25.94s
Response Time (max)	416.76s	138.75s
Response Time (total)	1740.97s	570.66s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

high

medium

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	5.7	5.9	58.3%	2		25.70s	536	149	3,214
GPT-5.4 Mini	8.6	7.9	91.7%	1		4.05s	606	296	2,876

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	6.3	8.7	33.3%	0		243.00s	5,090	383	84,580
GPT-5.4 Mini	8.4	7.4	88.9%	1		57.87s	7,305	467	40,902

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	10.0	10.0	100.0%	0		78.99s	66,082	4,582	25,404
GPT-5.4 Mini	6.9	5.9	66.7%	1		59.64s	74,058	4,347	40,924

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	10.0	10.0	100.0%	0		25.03s	7,690	274	2,166
GPT-5.4 Mini	10.0	10.0	100.0%	0		2.43s	7,140	234	650

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	3.6	7.2	22.2%	1		151.46s	569	4,404	50,391
GPT-5.4 Mini	4.1	4.4	44.5%	2		65.31s	619	60	43,286

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	10.0	10.0	100.0%	0		8.83s	471	115	1,013
GPT-5.4 Mini	4.5	10.0	0.0%	0		3.72s	477	150	510

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	7.8	6.6	83.3%	1		8.73s	627	66	2,726
GPT-5.4 Mini	9.8	10.0	100.0%	0		2.13s	660	96	1,185

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	6.9	4.9	77.8%	2		56.85s	591	178	2,563
GPT-5.4 Mini	7.8	10.0	66.7%	0		4.37s	642	278	2,443

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	9.8	10.0	100.0%	0		15.92s	8,909	295	701
GPT-5.4 Mini	4.7	1.6	66.7%	1		9.62s	5,453	251	2,594

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
DeepSeek V4 Pro	3.0	10.0	0.0%	0		34.01s	183	16	5,961
GPT-5.4 Mini	3.0	10.0	0.0%	0		30.10s	195	32	10,174

Switch Comparison Pair