AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Tencent: Hy3 preview

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-05-22

Metrik	DeepSeek V3.2 DeepSeek V3.2 none Rilis: 2025-12-01	Hy3 preview Hy3 preview high Rilis: 2026-04-22

Metrik	DeepSeek V3.2 DeepSeek V3.2 none Rilis: 2025-12-01	Hy3 preview Hy3 preview high Rilis: 2026-04-22
Skor	5.6	8.0
Peringkat	#114	#22
Keandalan	10.0	10.0
Konsistensi	8.0	9.5
Tes benar
Tingkat lulus per percobaan	46.7%	77.1%
Tes tidak stabil	5	1
Total Run	60	60
Biaya per hasil	0.254	0.000
Total Biaya	$0.018	$0.000
Harga input	$0.252 / 1M	$0.066 / 1M
Harga output	$0.378 / 1M	$0.260 / 1M
Token output	11,163	216,503
Token penalaran	0	0
Waktu respons (rata-rata)	14.46s	56.77s
Waktu respons (maks)	115.89s	149.94s
Waktu respons (total)	289.21s	851.49s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	3.3	8.2	12.5%	1		9.35s	1,073	0
Hy3 preview	8.9	10.0	100.0%	0		15.12s	6,839	0

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	3.1	5.4	16.7%	1		20.87s	4,522	0
Hy3 preview	10.0	10.0	100.0%	0		99.76s	38,167	0

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
Hy3 preview	10.0	10.0	100.0%	0		113.09s	31,319	0

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
Hy3 preview	6.5	10.0	50.0%	0		12.11s	4,323	0

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	3.0	6.9	16.7%	1		4.17s	21	0
Hy3 preview	5.3	7.2	44.4%	1		109.04s	87,559	0

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	7.6	10.0	100.0%	0		9.32s	43	0
Hy3 preview	0.0	0.0	0.0%	0		0ms	0	0

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
Hy3 preview	9.9	10.0	100.0%	0		34.02s	13,331	0

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	7.5	7.7	88.9%	1		7.13s	302	0
Hy3 preview	10.0	10.0	100.0%	0		29.74s	15,503	0

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
Hy3 preview	10.0	10.0	100.0%	0		78.83s	10,370	0

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	17	0
Hy3 preview	3.0	10.0	0.0%	0		47.71s	9,092	0

Perbandingan Cepat

Ganti Pasangan Perbandingan

DeepSeek V3.2nonevsgpt-oss-120bmediumTersedia gratis DeepSeek V3.2nonevsMiniMax M2.5mediumTersedia gratis DeepSeek V3.2nonevsMistral Small 4medium CobuddymediumTersedia gratisvsDeepSeek V3.2none DeepSeek V3.2nonevsElephant Alphamedium DeepSeek V3.2nonevsOwl Alphamedium DeepSeek V3.2nonevsNemotron 3 SupermediumTersedia gratis DeepSeek V3.2nonevsMiniMax M2.7medium DeepSeek V3.2nonevsGPT-5 Nanomedium DeepSeek V3.2nonevsMercury 2medium DeepSeek V3.2nonevsQwen3 Coder Nextmedium DeepSeek V3.2nonevsQwen3.6 27Bmedium