AI BENCHY Compare

Qwen: Qwen3.6 Plus vs Z.ai: GLM 5.2

Ringkasan

Perbandingan benchmark Qwen3.6 Plus vs GLM 5.2: Qwen3.6 Plus unggul dalam skor rata-rata dengan 7.8 vs 7.1. GLM 5.2 memiliki biaya benchmark lebih rendah di $0.051 vs $0.294. GLM 5.2 lebih cepat di 6.34s vs 30.70s, dengan tingkat keberhasilan 69.8% vs 60.3%.

Model yang direkomendasikan: GLM 5.2 - Its score stays close to the best score here (7.1 vs 7.8), while costing about 5.8x less than Qwen3.6 Plus.

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-07-02

Metrik	Qwen3.6 Plus Qwen3.6 Plus medium Rilis: 2026-04-20	GLM 5.2 GLM 5.2 none Rilis: 2026-06-17

Metrik	Qwen3.6 Plus Qwen3.6 Plus medium Rilis: 2026-04-20	GLM 5.2 GLM 5.2 none Rilis: 2026-06-17
Skor	7.8	7.1
Peringkat	#31	#63
Keandalan	10.0	9.9
Konsistensi	9.3	9.6
Tes benar
Tingkat lulus per percobaan	69.8%	60.3%
Tes tidak stabil	2	1
Total Run	63	63
Biaya per hasil	0.831	0.628
Total Biaya	$0.294	$0.051
Harga input	$0.325 / 1M	$0.930 / 1M
Harga output	$1.950 / 1M	$3.000 / 1M
Total token input	41,565	38,671
Token output	1,853	4,817
Token penalaran	141,973	0
Waktu respons (rata-rata)	30.70s	6.34s
Waktu respons (maks)	201.68s	20.69s
Waktu respons (total)	613.99s	133.19s

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#31 Qwen3.6 Plus

medium

Biaya: $0.024
Waktu: 219.0s
Token: 12,235 tok

#63 GLM 5.2

none

SVG tidak valid

Biaya: $0.033
Waktu: 87.7s
Token: 7,455 tok

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.6 Plus	10.0	10.0	100.0%	0		9.90s	672	207	7,557
GLM 5.2	8.3	10.0	75.0%	0		3.70s	567	313	0

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.6 Plus	6.1	7.8	44.4%	1		153.12s	7,098	58	50,586
GLM 5.2	3.7	9.5	0.0%	0		7.55s	7,263	1,958	0

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.6 Plus	10.0	10.0	100.0%	0		34.95s	14,934	452	13,073
GLM 5.2	10.0	10.0	100.0%	0		20.69s	14,296	1,489	0

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.6 Plus	10.0	10.0	100.0%	0		14.95s	7,782	270	10,706
GLM 5.2	10.0	10.0	100.0%	0		7.17s	7,113	204	0

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.6 Plus	2.9	7.2	11.1%	1		29.59s	771	56	33,464
GLM 5.2	5.3	10.0	33.3%	0		6.50s	696	27	0

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.6 Plus	5.1	10.0	0.0%	0		27.05s	516	111	5,232
GLM 5.2	6.1	3.1	66.7%	1		4.42s	480	82	0

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.6 Plus	10.0	10.0	100.0%	0		7.54s	699	102	5,552
GLM 5.2	9.8	10.0	100.0%	0		3.84s	642	66	0

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.6 Plus	10.0	10.0	100.0%	0		6.34s	696	309	6,712
GLM 5.2	7.7	10.0	66.7%	0		3.31s	618	265	0

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.6 Plus	10.0	10.0	100.0%	0		5.87s	8,193	267	1,330
GLM 5.2	10.0	10.0	100.0%	0		15.76s	6,807	400	0

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.6 Plus	3.0	10.0	0.0%	0		47.51s	204	21	7,761
GLM 5.2	3.0	10.0	0.0%	0		3.41s	189	13	0

Perbandingan Cepat

Ganti Pasangan Perbandingan

Gemma 4 26B A4BmediumTersedia gratisvsGLM 5.2none Step 3.7 FlashhighvsGLM 5.2none Laguna XS 2.1mediumTersedia gratisvsGLM 5.2none Claude Opus 4.8lowvsQwen3.6 Plusmedium Kimi K2.7 CodemediumvsGLM 5.2none Qwen3.6 PlusmediumvsStep 3.7 Flashlow Grok 4.20mediumvsGLM 5.2none DeepSeek V4 ProhighvsQwen3.6 Plusmedium Gemini 3 Flash PreviewlowvsGLM 5.2none MiMo-V2.5-PromediumvsGLM 5.2none Seed-2.0-MinimediumvsGLM 5.2none Qwen3.5-FlashmediumvsGLM 5.2none