AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs OpenAI: GPT-5 Nano

Last updated at: 2026-06-01

Metric	DeepSeek V3.2 DeepSeek V3.2 none Release: 2025-12-01	GPT-5 Nano GPT-5 Nano medium Release: 2025-08-07

Metric	DeepSeek V3.2 DeepSeek V3.2 none Release: 2025-12-01	GPT-5 Nano GPT-5 Nano medium Release: 2025-08-07
Score	5.6	6.1
Rank	#120	#100
Reliability	10.0	10.0
Consistency	8.3	7.1
Tests Correct
Attempt pass rate	41.7%	55.0%
Flaky tests	6	7
Total Runs	60	60
Cost per result	0.222	0.952
Total Cost	$0.018	$0.077
Input Price	$0.252 / 1M	$0.050 / 1M
Output Price	$0.378 / 1M	$0.400 / 1M
Output Tokens	11,159	5,328
Reasoning Tokens	0	181,056
Response Time (avg)	14.43s	43.52s
Response Time (max)	115.89s	204.02s
Response Time (total)	288.55s	565.82s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
DeepSeek V3.2	3.2	8.2	8.3%	1		9.35s	1,073	0
GPT-5 Nano	6.5	7.9	58.3%	1		25.50s	1,221	21,184

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
DeepSeek V3.2	3.1	5.4	16.7%	1		20.87s	4,522	0
GPT-5 Nano	5.4	6.6	33.3%	1		47.80s	604	30,144

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
GPT-5 Nano	10.0	10.0	100.0%	0		65.96s	578	17,984

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
GPT-5 Nano	3.7	1.7	50.0%	2		21.42s	453	10,560

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
DeepSeek V3.2	2.9	6.9	11.1%	1		4.17s	21	0
GPT-5 Nano	5.2	4.4	55.6%	2		204.02s	237	64,448

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
DeepSeek V3.2	6.8	10.0	66.7%	1		9.32s	43	0
GPT-5 Nano	4.1	10.0	0.0%	0		17.51s	202	4,608

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
GPT-5 Nano	9.8	10.0	100.0%	0		15.64s	312	4,736

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
DeepSeek V3.2	8.3	10.0	77.8%	1		6.91s	298	0
GPT-5 Nano	5.3	7.2	44.4%	1		20.63s	929	14,272

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
GPT-5 Nano	10.0	10.0	100.0%	0		33.30s	558	6,976

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	17	0
GPT-5 Nano	3.0	10.0	0.0%	0		20.13s	234	6,144

Quick Compare

Switch Comparison Pair

GPT-5 NanomediumvsMimo V2 Omninone Gemma 4 26B A4BnoneFree AvailablevsGPT-5 Nanomedium DeepSeek V4 PrononevsGPT-5 Nanomedium DeepSeek V3.2nonevsMiniMax M2.5medium DeepSeek V3.2nonevsMistral Small 4medium GPT-5 NanomediumvsQwen3.5-Flashnone CobuddymediumvsDeepSeek V3.2none DeepSeek V3.2nonevsElephant Alphamedium DeepSeek V3.2nonevsMiniMax M2.7medium GPT-5 NanomediumvsGLM 5none GPT-5 NanomediumvsGLM 5V Turbonone Seed-2.0-LitenonevsGPT-5 Nanomedium