Claude Sonnet 4.6 (medium) vs DeepSeek V4 Pro (high)

Model yang direkomendasikan DeepSeek V4 Pro (high)

Its score stays close to the best score here (7.7 vs 7.8), while costing about 10.3x less than Claude Sonnet 4.6 (medium).

Perbandingan terperinci

Metrik	Claude Sonnet 4.6 Claude Sonnet 4.6 medium Rilis: 2026-02-17	DeepSeek V4 Pro DeepSeek V4 Pro high Rilis: 2026-04-24

Metrik	Claude Sonnet 4.6 Claude Sonnet 4.6 medium Rilis: 2026-02-17	DeepSeek V4 Pro DeepSeek V4 Pro high Rilis: 2026-04-24
Skor	7.8	7.7
Peringkat	#51	#58
Keandalan	10.0	10.0
Konsistensi	9.2	7.7
Tes benar
Tingkat lulus per percobaan	66.7%	63.6%
Tes tidak stabil	2	6
Total Run	66	66
Biaya per hasil	14.692	2.000
Total Biaya	$2.057	$0.200
Harga input	$3.000 / 1M	$0.435 / 1M
Harga output	$15.000 / 1M	$0.870 / 1M
Total token input	106,292	90,748
Token output	80,748	10,462
Token penalaran	35,117	178,719
Waktu respons (rata-rata)	25.91s	79.14s
Waktu respons (maks)	140.96s	416.76s
Waktu respons (total)	362.78s	1740.97s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

SVG tidak valid

high

Kategori:

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Sonnet 4.6	6.5	10.0	50.0%	0		2.98s	789	1,046	1,093
DeepSeek V4 Pro	5.7	5.9	58.3%	2		25.70s	536	149	3,214

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Sonnet 4.6	5.7	6.6	44.4%	1		33.29s	6,995	16,089	3,686
DeepSeek V4 Pro	6.3	8.7	33.3%	0		243.00s	5,090	383	84,580

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Sonnet 4.6	10.0	10.0	100.0%	0		93.65s	75,531	31,916	9,109
DeepSeek V4 Pro	10.0	10.0	100.0%	0		78.99s	66,082	4,582	25,404

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Sonnet 4.6	10.0	10.0	100.0%	0		13.90s	8,676	649	742
DeepSeek V4 Pro	10.0	10.0	100.0%	0		25.03s	7,690	274	2,166

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Sonnet 4.6	2.9	7.2	11.1%	1		0ms	471	25,790	16,919
DeepSeek V4 Pro	3.6	7.2	22.2%	1		151.46s	569	4,404	50,391

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.94s	564	256	433
DeepSeek V4 Pro	10.0	10.0	100.0%	0		8.83s	471	115	1,013

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Sonnet 4.6	10.0	10.0	100.0%	0		2.61s	792	318	552
DeepSeek V4 Pro	7.8	6.6	83.3%	1		8.73s	627	66	2,726

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Sonnet 4.6	10.0	10.0	100.0%	0		5.31s	816	592	646
DeepSeek V4 Pro	6.9	4.9	77.8%	2		56.85s	591	178	2,563

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Sonnet 4.6	10.0	10.0	100.0%	0		7.48s	11,454	655	351
DeepSeek V4 Pro	9.8	10.0	100.0%	0		15.92s	8,909	295	701

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Sonnet 4.6	3.0	10.0	0.0%	0		30.09s	204	3,437	1,586
DeepSeek V4 Pro	3.0	10.0	0.0%	0		34.01s	183	16	5,961

Ganti Pasangan Perbandingan