AI BENCHY Compare

Qwen: Qwen3.6 35B A3B vs HY3 Preview

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-04-27

Metrik	Qwen3.6 35B A3B Qwen3.6 35B A3B medium Rilis: 2026-04-20	HY3 Preview HY3 Preview high Rilis: 2026-04-22 Tersedia gratis

Metrik	Qwen3.6 35B A3B Qwen3.6 35B A3B medium Rilis: 2026-04-20	HY3 Preview HY3 Preview high Rilis: 2026-04-22 Tersedia gratis
Skor	8.8	8.5
Peringkat	#9	#13
Keandalan	10.0	T/A
Konsistensi	9.5	8.8
Tes benar
Tingkat lulus per percobaan	83.3%	81.5%
Tes tidak stabil	1	3
Total Run	54	50
Biaya per hasil	0.800	0.000
Total Biaya	$0.104	$0.000
Harga input	$0.162 / 1M	$0.000 / 1M
Harga output	$0.966 / 1M	$0.000 / 1M
Token output	14,256	238,920
Token penalaran	98,005	0
Waktu respons (rata-rata)	11.98s	55.19s
Waktu respons (maks)	45.02s	149.94s
Waktu respons (total)	191.76s	938.23s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		6.02s	1,154	12,385
HY3 Preview	10.0	10.0	100.0%	0		32.69s	26,550	0

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		32.58s	3,294	15,116
HY3 Preview	10.0	10.0	100.0%	0		99.76s	38,167	0

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Qwen3.6 35B A3B	0.0	0.0	0.0%	0		0ms	0	0
HY3 Preview	10.0	10.0	100.0%	0		113.09s	31,319	0

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		12.99s	2,591	9,968
HY3 Preview	6.5	10.0	50.0%	0		12.11s	4,323	0

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Qwen3.6 35B A3B	5.3	7.2	44.4%	1		22.50s	6,193	39,116
HY3 Preview	5.3	7.2	44.4%	1		109.04s	87,559	0

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Qwen3.6 35B A3B	4.4	9.9	0.0%	0		8.66s	129	4,569
HY3 Preview	10.0	10.0	100.0%	0		24.31s	5,490	0

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		7.50s	219	7,404
HY3 Preview	8.5	6.8	83.3%	1		34.02s	13,331	0

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		5.98s	676	9,447
HY3 Preview	9.0	7.9	88.9%	1		28.07s	21,811	0

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Qwen3.6 35B A3B	0.0	0.0	0.0%	0		0ms	0	0
HY3 Preview	10.0	10.0	100.0%	0		78.83s	10,370	0

Perbandingan Cepat

Ganti Pasangan Perbandingan

Qwen3.5 Plus 2026-02-15mediumvsHY3 PreviewhighTersedia gratis Qwen3.6 Plus PreviewmediumTersedia gratisvsHY3 PreviewhighTersedia gratis Gemini 3 Flash PreviewlowvsQwen3.6 35B A3Bmedium Qwen3.5-27BmediumvsHY3 PreviewhighTersedia gratis GPT-5.3-CodexmediumvsHY3 PreviewhighTersedia gratis Gemini 3 PRO PreviewmediumvsHY3 PreviewhighTersedia gratis Seed-2.0-LitemediumvsHY3 PreviewhighTersedia gratis HY3 PreviewhighTersedia gratisvsGLM 5medium Gemma 4 31BmediumTersedia gratisvsHY3 PreviewhighTersedia gratis Gemini 2.5 FlashmediumvsHY3 PreviewhighTersedia gratis GPT-5.5lowvsQwen3.6 35B A3Bmedium GPT-5.4mediumvsHY3 PreviewhighTersedia gratis