Claude Opus 4.6 (medium) vs DeepSeek V4 Flash (high)

Model yang direkomendasikan DeepSeek V4 Flash (high)

It has the best score here (7.7), while costing about 51.1x less than Claude Opus 4.6 (medium).

Perbandingan terperinci

Metrik	Claude Opus 4.6 Claude Opus 4.6 medium Rilis: 2026-02-05	DeepSeek V4 Flash DeepSeek V4 Flash high Rilis: 2026-04-24

Metrik	Claude Opus 4.6 Claude Opus 4.6 medium Rilis: 2026-02-05	DeepSeek V4 Flash DeepSeek V4 Flash high Rilis: 2026-04-24
Skor	7.7	7.7
Peringkat	#51	#53
Keandalan	10.0	10.0
Konsistensi	8.8	8.2
Tes benar
Tingkat lulus per percobaan	63.6%	72.7%
Tes tidak stabil	3	5
Total Run	66	66
Biaya per hasil	23.524	0.402
Total Biaya	$3.059	$0.060
Harga input	$5.000 / 1M	$0.140 / 1M
Harga output	$25.000 / 1M	$0.280 / 1M
Total token input	108,615	108,392
Token output	72,286	14,478
Token penalaran	28,315	153,687
Waktu respons (rata-rata)	34.27s	49.75s
Waktu respons (maks)	151.51s	218.13s
Waktu respons (total)	513.99s	1094.41s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

SVG tidak valid

high

Kategori:

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.6	6.4	5.8	66.7%	2		7.45s	840	986	1,071
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	540	140	7,770

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.6	5.7	7.1	44.4%	1		30.10s	8,522	13,057	4,121
DeepSeek V4 Flash	7.8	10.0	66.7%	0		50.60s	7,279	395	34,862

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.6	10.0	10.0	100.0%	0		114.08s	76,073	33,018	9,509
DeepSeek V4 Flash	6.4	5.8	66.7%	1		104.10s	82,663	4,633	37,533

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.6	10.0	10.0	100.0%	0		7.37s	8,676	691	757
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	7,290	201	1,179

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.6	3.0	10.0	0.0%	0		83.40s	674	14,642	8,687
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	666	27	59,249

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.6	10.0	10.0	100.0%	0		5.04s	564	188	292
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	471	79	632

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.6	10.0	10.0	100.0%	0		2.43s	792	266	467
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	627	63	1,622

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.6	7.7	10.0	66.7%	0		4.71s	816	532	630
DeepSeek V4 Flash	8.2	7.2	88.9%	1		26.11s	594	196	1,767

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.6	10.0	10.0	100.0%	0		9.73s	11,454	861	329
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	8,079	228	542

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.6	3.0	10.0	0.0%	0		63.24s	204	8,045	2,452
DeepSeek V4 Flash	3.0	10.0	0.0%	0		54.46s	183	8,516	8,531

Ganti Pasangan Perbandingan