Qwen3.7 Plus vs GLM 5.1 (medium)

Model yang direkomendasikan Qwen3.7 Plus

It has the best score here (7.2), while costing about 5.0x less than GLM 5.1 (medium).

Perbandingan terperinci

Metrik	Qwen3.7 Plus Qwen3.7 Plus none Rilis: 2026-06-03	GLM 5.1 GLM 5.1 medium Rilis: 2026-04-07

Metrik	Qwen3.7 Plus Qwen3.7 Plus none Rilis: 2026-06-03	GLM 5.1 GLM 5.1 medium Rilis: 2026-04-07
Skor	7.2	7.1
Peringkat	#79	#82
Keandalan	10.0	8.3
Konsistensi	10.0	8.4
Tes benar
Tingkat lulus per percobaan	50.0%	69.7%
Tes tidak stabil	0	4
Total Run	66	66
Biaya per hasil	1.014	4.202
Total Biaya	$0.106	$0.535
Harga input	$0.320 / 1M	$0.966 / 1M
Harga output	$1.280 / 1M	$3.036 / 1M
Total token input	98,824	82,623
Token output	58,097	16,089
Token penalaran	0	136,463
Waktu respons (rata-rata)	12.09s	46.77s
Waktu respons (maks)	206.03s	308.75s
Waktu respons (total)	265.89s	982.16s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

SVG tidak valid

Kategori:

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.7 Plus	6.5	10.0	50.0%	0		1.38s	696	349	0
GLM 5.1	10.0	10.0	100.0%	0		8.31s	555	401	5,122

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.7 Plus	5.5	10.0	33.3%	0		2.15s	7,911	639	0
GLM 5.1	4.6	3.7	44.5%	2		109.63s	5,702	4,871	37,826

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.7 Plus	10.0	10.0	100.0%	0		117.70s	71,266	56,024	0
GLM 5.1	9.8	10.0	100.0%	0		175.93s	66,926	4,761	65,248

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.7 Plus	10.0	10.0	100.0%	0		1.43s	7,794	243	0
GLM 5.1	10.0	10.0	100.0%	0		9.33s	7,107	991	4,552

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.7 Plus	3.0	10.0	0.0%	0		868ms	789	18	0
GLM 5.1	5.3	10.0	33.3%	0		29.77s	489	969	11,314

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.7 Plus	5.3	10.0	0.0%	0		1.33s	522	78	0
GLM 5.1	10.0	10.0	100.0%	0		20.95s	477	2,875	2,875

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.7 Plus	6.3	10.0	50.0%	0		929ms	711	72	0
GLM 5.1	6.4	5.8	66.7%	1		7.47s	634	204	1,617

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.7 Plus	7.7	10.0	66.7%	0		1.71s	714	443	0
GLM 5.1	8.2	7.2	88.9%	1		31.64s	609	935	5,730

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.7 Plus	10.0	10.0	100.0%	0		3.54s	8,211	222	0
GLM 5.1	3.0	10.0	0.0%	0		0ms	0	0	0

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Qwen3.7 Plus	3.0	10.0	0.0%	0		1.21s	210	9	0
GLM 5.1	3.0	10.0	0.0%	0		29.40s	124	82	2,179

Ganti Pasangan Perbandingan