DeepSeek V4 Flash (high) vs Qwen3.7 Plus (medium)

Model yang direkomendasikan DeepSeek V4 Flash (high)

Its score stays close to the best score here (7.7 vs 7.9), while costing about 4.5x less than Qwen3.7 Plus (medium).

Perbandingan terperinci

Metrik	DeepSeek V4 Flash DeepSeek V4 Flash high Rilis: 2026-04-24	Qwen3.7 Plus Qwen3.7 Plus medium Rilis: 2026-06-03

Metrik	DeepSeek V4 Flash DeepSeek V4 Flash high Rilis: 2026-04-24	Qwen3.7 Plus Qwen3.7 Plus medium Rilis: 2026-06-03
Skor	7.7	7.9
Peringkat	#53	#43
Keandalan	10.0	10.0
Konsistensi	8.2	8.9
Tes benar
Tingkat lulus per percobaan	72.7%	75.8%
Tes tidak stabil	5	3
Total Run	66	66
Biaya per hasil	0.402	2.072
Total Biaya	$0.060	$0.267
Harga input	$0.140 / 1M	$0.320 / 1M
Harga output	$0.280 / 1M	$1.280 / 1M
Total token input	108,392	115,233
Token output	14,478	6,162
Token penalaran	153,687	173,267
Waktu respons (rata-rata)	49.75s	51.51s
Waktu respons (maks)	218.13s	315.30s
Waktu respons (total)	1094.41s	1133.15s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

high

medium

Kategori:

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	540	140	7,770
Qwen3.7 Plus	10.0	10.0	100.0%	0		8.58s	672	195	5,065

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	7.8	10.0	66.7%	0		50.60s	7,279	395	34,862
Qwen3.7 Plus	6.1	6.6	55.6%	1		108.60s	6,472	414	43,576

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	6.4	5.8	66.7%	1		104.10s	82,663	4,633	37,533
Qwen3.7 Plus	8.2	6.9	66.7%	1		190.27s	89,228	4,403	57,645

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	7,290	201	1,179
Qwen3.7 Plus	10.0	10.0	100.0%	0		21.75s	7,782	270	6,713

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	666	27	59,249
Qwen3.7 Plus	3.6	7.2	22.2%	1		45.35s	771	57	27,073

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	471	79	632
Qwen3.7 Plus	10.0	10.0	100.0%	0		25.48s	516	123	3,998

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	627	63	1,622
Qwen3.7 Plus	10.0	10.0	100.0%	0		16.13s	699	102	5,013

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	8.2	7.2	88.9%	1		26.11s	594	196	1,767
Qwen3.7 Plus	10.0	10.0	100.0%	0		16.38s	696	280	7,312

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	8,079	228	542
Qwen3.7 Plus	10.0	10.0	100.0%	0		15.02s	8,193	292	1,831

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
DeepSeek V4 Flash	3.0	10.0	0.0%	0		54.46s	183	8,516	8,531
Qwen3.7 Plus	3.0	10.0	0.0%	0		91.07s	204	26	15,041

Ganti Pasangan Perbandingan