AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs MiniMax: MiniMax M2.7

Ringkasan

Perbandingan benchmark DeepSeek V4 Pro vs MiniMax M2.7: DeepSeek V4 Pro unggul dalam skor rata-rata dengan 7.6 vs 5.2. MiniMax M2.7 memiliki biaya benchmark lebih rendah di $0.104 vs $0.157. MiniMax M2.7 lebih cepat di 38.18s vs 77.20s, dengan tingkat keberhasilan 66.7% vs 46.0%.

Model yang direkomendasikan: DeepSeek V4 Pro - It has the strongest score in this comparison (7.6) and the best overall balance of cost and response time across all 2 models.

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-06-18

Metrik	DeepSeek V4 Pro DeepSeek V4 Pro high Rilis: 2026-04-24	MiniMax M2.7 MiniMax M2.7 medium Rilis: 2026-03-18

Metrik	DeepSeek V4 Pro DeepSeek V4 Pro high Rilis: 2026-04-24	MiniMax M2.7 MiniMax M2.7 medium Rilis: 2026-03-18
Skor	7.6	5.2
Peringkat	#41	#127
Keandalan	9.3	10.0
Konsistensi	7.0	6.8
Tes benar
Tingkat lulus per percobaan	66.7%	46.0%
Tes tidak stabil	8	8
Total Run	63	63
Biaya per hasil	1.742	2.494
Total Biaya	$0.157	$0.104
Harga input	$0.435 / 1M	$0.250 / 1M
Harga output	$0.870 / 1M	$1.000 / 1M
Total token input	38,726	34,371
Token output	6,334	8,981
Token penalaran	159,151	89,812
Waktu respons (rata-rata)	77.20s	38.18s
Waktu respons (maks)	416.76s	196.21s
Waktu respons (total)	1621.17s	763.60s

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#41 DeepSeek V4 Pro

high

Biaya: $0.023
Waktu: 257.6s
Token: 14,870 tok

#127 MiniMax M2.7

medium

Biaya: $0.022
Waktu: 22.8s
Token: 9,250 tok

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Pro	5.7	5.9	58.3%	2		25.70s	536	149	3,214
MiniMax M2.7	7.9	6.3	83.3%	2		40.32s	654	3,010	17,716

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Pro	6.1	4.6	66.7%	2		243.00s	5,090	383	84,580
MiniMax M2.7	5.7	9.1	33.3%	0		101.89s	2,961	1,231	38,841

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Pro	10.0	10.0	100.0%	0		38.17s	14,060	454	5,836
MiniMax M2.7	4.7	1.6	66.7%	1		41.03s	14,233	369	4,480

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Pro	10.0	10.0	100.0%	0		25.03s	7,690	274	2,166
MiniMax M2.7	6.3	5.8	66.7%	1		21.95s	7,152	187	5,882

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Pro	3.6	7.2	22.2%	1		151.46s	569	4,404	50,391
MiniMax M2.7	3.0	10.0	0.0%	0		19.00s	245	8	2,796

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Pro	10.0	10.0	100.0%	0		8.83s	471	115	1,013
MiniMax M2.7	3.9	2.5	33.3%	1		38.70s	486	92	5,204

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Pro	7.8	6.6	83.3%	1		8.73s	627	66	2,726
MiniMax M2.7	3.8	5.8	33.3%	1		12.80s	687	350	2,600

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Pro	6.9	4.9	77.8%	2		56.85s	591	178	2,563
MiniMax M2.7	5.9	7.2	55.6%	1		24.87s	675	362	7,840

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Pro	9.8	10.0	100.0%	0		15.92s	8,909	295	701
MiniMax M2.7	4.7	1.6	66.7%	1		12.05s	7,067	304	1,001

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Pro	3.0	10.0	0.0%	0		34.01s	183	16	5,961
MiniMax M2.7	3.0	10.0	0.0%	0		22.77s	211	3,068	3,452

Perbandingan Cepat

Ganti Pasangan Perbandingan

DeepSeek V4 ProhighvsMiniMax M3medium MiniMax M2.7mediumvsQwen3.6 35B A3Bnone DeepSeek V4 ProhighvsGrok Build 0.1medium MiniMax M2.7mediumvsMistral Small 4none MiniMax M2.7mediumvsQwen3 Coder Nextnone DeepSeek V4 ProhighvsKimi K2.5medium DeepSeek V4 ProhighvsMercury 2medium North Mini CodenoneTersedia gratisvsMiniMax M2.7medium MiniMax M2.7mediumvsMiMo-V2.5none DeepSeek V4 ProhighvsStep 3.7 Flashlow Claude Opus 4.6mediumvsDeepSeek V4 Prohigh DeepSeek V3.2nonevsMiniMax M2.7medium