AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs MiniMax: MiniMax M2.7

Ringkasan

Skor rata-rata hampir imbang di 5.0 vs 5.0. DeepSeek V3.2 memiliki biaya benchmark lebih rendah di $0.054 vs $0.196. DeepSeek V3.2 lebih cepat di 18.25s vs 41.28s, dengan tingkat keberhasilan 37.9% vs 45.5%.

Model yang direkomendasikanDeepSeek V3.2It has the best score here (5.0), while costing about 3.7x less than MiniMax M2.7 (medium).

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-07-17

Metrik	DeepSeek V3.2 DeepSeek V3.2 none Rilis: 2025-12-01	MiniMax M2.7 MiniMax M2.7 medium Rilis: 2026-03-18

Metrik	DeepSeek V3.2 DeepSeek V3.2 none Rilis: 2025-12-01	MiniMax M2.7 MiniMax M2.7 medium Rilis: 2026-03-18
Skor	5.0	5.0
Peringkat	#165	#164
Keandalan	10.0	10.0
Konsistensi	7.7	6.6
Tes benar
Tingkat lulus per percobaan	37.9%	45.5%
Tes tidak stabil	6	9
Total Run	66	66
Biaya per hasil	0.870	3.906
Total Biaya	$0.054	$0.196
Harga input	$0.269 / 1M	$0.300 / 1M
Harga output	$0.400 / 1M	$1.200 / 1M
Total token input	135,780	114,518
Token output	42,097	18,558
Token penalaran	0	119,036
Waktu respons (rata-rata)	18.25s	41.28s
Waktu respons (maks)	115.89s	196.21s
Waktu respons (total)	401.60s	866.81s

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#165 DeepSeek V3.2

none

Biaya: $0.002
Waktu: 7.0s
Token: 1,046 tok

#164 MiniMax M2.7

medium

Biaya: $0.022
Waktu: 22.8s
Token: 9,250 tok

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Kategori:

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V3.2	3.2	8.0	8.3%	1		9.35s	494	1,073	0
MiniMax M2.7	7.9	6.3	83.3%	2		40.32s	654	3,010	17,716

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V3.2	3.1	6.9	11.1%	1		14.54s	7,279	4,528	0
MiniMax M2.7	5.7	9.1	33.3%	0		101.89s	2,961	1,231	38,841

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V3.2	4.8	10.0	0.0%	0		113.53s	109,626	33,819	0
MiniMax M2.7	3.8	1.6	50.0%	2		72.12s	94,380	9,946	33,704

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	7,890	1,710	0
MiniMax M2.7	6.3	5.8	66.7%	1		21.95s	7,152	187	5,882

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V3.2	2.9	7.2	11.1%	1		4.17s	624	21	0
MiniMax M2.7	3.0	10.0	0.0%	0		19.00s	245	8	2,796

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V3.2	4.7	1.6	66.7%	1		9.32s	314	43	0
MiniMax M2.7	3.9	2.5	33.3%	1		38.70s	486	92	5,204

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	627	66	0
MiniMax M2.7	3.8	5.8	33.3%	1		12.80s	687	350	2,600

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V3.2	7.6	7.2	77.8%	1		6.91s	424	298	0
MiniMax M2.7	5.9	7.2	55.6%	1		24.87s	675	362	7,840

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	8,319	522	0
MiniMax M2.7	4.7	1.6	66.7%	1		12.05s	7,067	304	1,001

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	183	17	0
MiniMax M2.7	3.0	10.0	0.0%	0		22.77s	211	3,068	3,452

Perbandingan Cepat

Ganti Pasangan Perbandingan

North Mini CodenoneTersedia gratisvsMiniMax M2.7medium MiniMax M2.7mediumvsQwen3.5-9Bnone MiniMax M2.7mediumvsMiMo-V2.5none MiniMax M2.7mediumvsGPT-4o-mininone MiniMax M2.7mediumvsQwen3 Coder Nextnone MiniMax M2.7mediumvsMistral Small 4none DeepSeek V3.2nonevsMistral Small 4medium MiniMax M2.7mediumvsGLM 4.7 Flashnone MiniMax M2.7mediumvsNemotron 3 SupernoneTersedia gratis Ling-2.6-flashnonevsMiniMax M2.7medium Ring-2.6-1TnonevsMiniMax M2.7medium MiniMax M2.7mediumvsGPT-5.4 Nanonone