AI BENCHY Compare

inclusionAI: Ling-2.6-flash vs Tencent: Hy3 preview

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-05-22

Metrik	Ling-2.6-flash Ling-2.6-flash none Rilis: 2026-04-21	Hy3 preview Hy3 preview high Rilis: 2026-04-22

Metrik	Ling-2.6-flash Ling-2.6-flash none Rilis: 2026-04-21	Hy3 preview Hy3 preview high Rilis: 2026-04-22
Skor	5.3	8.0
Peringkat	#128	#22
Keandalan	10.0	10.0
Konsistensi	9.2	9.5
Tes benar
Tingkat lulus per percobaan	35.1%	77.1%
Tes tidak stabil	2	1
Total Run	60	60
Biaya per hasil	0.005	0.000
Total Biaya	$0.001	$0.000
Harga input	$0.010 / 1M	$0.066 / 1M
Harga output	$0.030 / 1M	$0.260 / 1M
Token output	2,878	216,503
Token penalaran	0	0
Waktu respons (rata-rata)	9.76s	56.77s
Waktu respons (maks)	35.34s	149.94s
Waktu respons (total)	185.37s	851.49s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Ling-2.6-flash	6.8	8.1	58.3%	1		11.81s	573	0
Hy3 preview	8.9	10.0	100.0%	0		15.12s	6,839	0

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Ling-2.6-flash	10.0	10.0	100.0%	0		11.21s	381	0
Hy3 preview	10.0	10.0	100.0%	0		99.76s	38,167	0

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Ling-2.6-flash	3.0	10.0	0.0%	0		35.34s	1,069	0
Hy3 preview	10.0	10.0	100.0%	0		113.09s	31,319	0

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Ling-2.6-flash	6.5	10.0	50.0%	0		8.48s	246	0
Hy3 preview	6.5	10.0	50.0%	0		12.11s	4,323	0

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Ling-2.6-flash	3.0	10.0	0.0%	0		4.95s	24	0
Hy3 preview	5.3	7.2	44.4%	1		109.04s	87,559	0

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Ling-2.6-flash	4.0	10.0	0.0%	0		1.45s	109	0
Hy3 preview	0.0	0.0	0.0%	0		0ms	0	0

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Ling-2.6-flash	9.8	10.0	100.0%	0		5.52s	81	0
Hy3 preview	9.9	10.0	100.0%	0		34.02s	13,331	0

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Ling-2.6-flash	2.9	7.2	11.1%	1		9.14s	151	0
Hy3 preview	10.0	10.0	100.0%	0		29.74s	15,503	0

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Ling-2.6-flash	3.0	10.0	0.0%	0		18.80s	229	0
Hy3 preview	10.0	10.0	100.0%	0		78.83s	10,370	0

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Ling-2.6-flash	3.0	10.0	0.0%	0		1.06s	15	0
Hy3 preview	3.0	10.0	0.0%	0		47.71s	9,092	0

Perbandingan Cepat

Ganti Pasangan Perbandingan

Ling-2.6-flashnonevsElephant Alphamedium Ling-2.6-flashnonevsMistral Small 4medium Ling-2.6-flashnonevsMiniMax M2.5mediumTersedia gratis Ling-2.6-flashnonevsMiniMax M2.7medium Ling-2.6-flashnonevsgpt-oss-120bmediumTersedia gratis CobuddymediumTersedia gratisvsLing-2.6-flashnone Ling-2.6-flashnonevsQwen3 Coder Nextmedium Ling-2.6-flashnonevsOwl Alphamedium Ling-2.6-flashnonevsNemotron 3 SupermediumTersedia gratis Ling-2.6-flashnonevsGPT-5 Nanomedium Ling-2.6-flashnonevsGLM 4.7 Flashmedium Mercury 2mediumvsLing-2.6-flashnone