Claude Opus 4.7 (medium) vs GLM 5.2 (medium)

Model yang direkomendasikan Claude Opus 4.7 (medium)

It has the best score here (8.7), while responding about 3.1x faster than GLM 5.2 (medium).

Perbandingan terperinci

Metrik	Claude Opus 4.7 Claude Opus 4.7 medium Rilis: 2026-04-16	GLM 5.2 GLM 5.2 medium Rilis: 2026-06-17

Metrik	Claude Opus 4.7 Claude Opus 4.7 medium Rilis: 2026-04-16	GLM 5.2 GLM 5.2 medium Rilis: 2026-06-17
Skor	8.7	7.8
Peringkat	#21	#49
Keandalan	10.0	9.5
Konsistensi	9.6	8.0
Cakupan benchmark	22/22 tes · 66/66 percobaan	21/22 tes · 63/66 percobaan
Tes benar
Tingkat lulus per percobaan	83.3%	80.3%
Tes tidak stabil	1	4
Total Run	66	63
Biaya per hasil	8.201	2.159
Total Biaya	$1.477	$0.066
Harga input	$5.000 / 1M	$0.285 / 1M
Harga output	$25.000 / 1M	$0.894 / 1M
Total token input	145,252	37,199
Token output	24,948	12,261
Token penalaran	5,042	49,500
Waktu respons (rata-rata)	7.61s	23.28s
Waktu respons (maks)	65.40s	101.36s
Waktu respons (total)	159.91s	488.94s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

medium

Kategori:

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
GLM 5.2	10.0	10.0	100.0%	0		5.89s	639	497	2,634

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
GLM 5.2	8.2	7.2	88.9%	1		40.96s	7,317	1,475	17,123

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	10.0	10.0	100.0%	0		43.42s	104,347	15,459	3,928
GLM 5.2	5.0	5.0	50.0%	0		51.96s	12,696	458	4,531

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
GLM 5.2	10.0	10.0	100.0%	0		13.44s	7,149	348	2,345

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
GLM 5.2	4.1	4.4	44.5%	2		45.47s	551	8,188	11,606

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
GLM 5.2	10.0	10.0	100.0%	0		17.39s	498	54	1,842

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
GLM 5.2	9.9	10.0	100.0%	0		7.90s	678	94	1,518

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
GLM 5.2	8.2	7.2	88.9%	1		13.13s	672	536	4,822

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
GLM 5.2	10.0	10.0	100.0%	0		20.41s	6,861	230	550

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
GLM 5.2	3.0	10.0	0.0%	0		34.25s	138	381	2,529

Ganti Pasangan Perbandingan