AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs OpenAI: GPT-5 Nano

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-06-01

Metrik	DeepSeek V3.2 DeepSeek V3.2 none Rilis: 2025-12-01	GPT-5 Nano GPT-5 Nano medium Rilis: 2025-08-07

Metrik	DeepSeek V3.2 DeepSeek V3.2 none Rilis: 2025-12-01	GPT-5 Nano GPT-5 Nano medium Rilis: 2025-08-07
Skor	5.6	6.1
Peringkat	#120	#100
Keandalan	10.0	10.0
Konsistensi	8.3	7.1
Tes benar
Tingkat lulus per percobaan	41.7%	55.0%
Tes tidak stabil	6	7
Total Run	60	60
Biaya per hasil	0.222	0.952
Total Biaya	$0.018	$0.077
Harga input	$0.252 / 1M	$0.050 / 1M
Harga output	$0.378 / 1M	$0.400 / 1M
Token output	11,159	5,328
Token penalaran	0	181,056
Waktu respons (rata-rata)	14.43s	43.52s
Waktu respons (maks)	115.89s	204.02s
Waktu respons (total)	288.55s	565.82s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	3.2	8.2	8.3%	1		9.35s	1,073	0
GPT-5 Nano	6.5	7.9	58.3%	1		25.50s	1,221	21,184

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	3.1	5.4	16.7%	1		20.87s	4,522	0
GPT-5 Nano	5.4	6.6	33.3%	1		47.80s	604	30,144

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
GPT-5 Nano	10.0	10.0	100.0%	0		65.96s	578	17,984

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
GPT-5 Nano	3.7	1.7	50.0%	2		21.42s	453	10,560

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	2.9	6.9	11.1%	1		4.17s	21	0
GPT-5 Nano	5.2	4.4	55.6%	2		204.02s	237	64,448

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	6.8	10.0	66.7%	1		9.32s	43	0
GPT-5 Nano	4.1	10.0	0.0%	0		17.51s	202	4,608

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
GPT-5 Nano	9.8	10.0	100.0%	0		15.64s	312	4,736

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	8.3	10.0	77.8%	1		6.91s	298	0
GPT-5 Nano	5.3	7.2	44.4%	1		20.63s	929	14,272

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
GPT-5 Nano	10.0	10.0	100.0%	0		33.30s	558	6,976

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	17	0
GPT-5 Nano	3.0	10.0	0.0%	0		20.13s	234	6,144

Perbandingan Cepat

Ganti Pasangan Perbandingan

GPT-5 NanomediumvsMimo V2 Omninone Gemma 4 26B A4BnoneTersedia gratisvsGPT-5 Nanomedium DeepSeek V4 PrononevsGPT-5 Nanomedium DeepSeek V3.2nonevsMiniMax M2.5medium DeepSeek V3.2nonevsMistral Small 4medium GPT-5 NanomediumvsQwen3.5-Flashnone CobuddymediumvsDeepSeek V3.2none DeepSeek V3.2nonevsElephant Alphamedium DeepSeek V3.2nonevsMiniMax M2.7medium GPT-5 NanomediumvsGLM 5none GPT-5 NanomediumvsGLM 5V Turbonone Seed-2.0-LitenonevsGPT-5 Nanomedium