AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs Z.ai: GLM 5 Turbo

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-03-15

Metrik	GPT-5.2 Chat GPT-5.2 Chat none Rilis: 2025-12-11	GLM 5 Turbo GLM 5 Turbo medium Rilis: 2026-03-15

Metrik	GPT-5.2 Chat GPT-5.2 Chat none Rilis: 2025-12-11	GLM 5 Turbo GLM 5 Turbo medium Rilis: 2026-03-15
Peringkat	#17	#20
Skor	8.0	7.9
Konsistensi	9.1	7.7
Biaya per hasil	2.440	1.641
Total Biaya	$0.269	$0.165
Tes benar
Tingkat lulus per percobaan	75.0%	75.0%
Tes tidak stabil	2	5
Total Run	48	48
Token output	15,845	11,853
Token penalaran	0	35,095
Waktu respons (rata-rata)	7.03s	18.84s
Waktu respons (maks)	38.52s	194.23s
Waktu respons (total)	112.51s	301.50s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
GPT-5.2 Chat	10.0	10.0	100.0%	0		3.97s	1,651	0
GLM 5 Turbo	10.0	10.0	100.0%	0		5.01s	350	2,600

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
GPT-5.2 Chat	10.0	10.0	100.0%	0		9.12s	1,243	0
GLM 5 Turbo	10.0	10.0	100.0%	0		13.88s	390	2,037

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
GPT-5.2 Chat	10.0	10.0	100.0%	0		3.05s	980	0
GLM 5 Turbo	10.0	10.0	100.0%	0		6.19s	577	3,632

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
GPT-5.2 Chat	5.3	10.0	33.3%	0		17.78s	7,810	0
GLM 5 Turbo	2.9	4.4	22.2%	2		71.07s	9,665	19,279

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
GPT-5.2 Chat	4.4	3.0	33.3%	1		3.20s	335	0
GLM 5 Turbo	6.1	3.1	66.7%	1		10.05s	60	2,216

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
GPT-5.2 Chat	7.5	6.1	83.3%	1		5.46s	1,528	0
GLM 5 Turbo	10.0	10.0	100.0%	0		5.38s	255	2,183

Puzzle Solving	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
GPT-5.2 Chat	7.7	10.0	66.7%	0		4.42s	1,743	0
GLM 5 Turbo	7.3	5.8	55.6%	2		5.44s	315	2,702

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
GPT-5.2 Chat	10.0	10.0	100.0%	0		4.68s	555	0
GLM 5 Turbo	10.0	10.0	100.0%	0		9.84s	241	446

Perbandingan Cepat

Ganti Pasangan Perbandingan

Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone Gemini 3 Flash PreviewnonevsGLM 5 Turbomedium Gemini 3.1 Flash Lite PreviewlowvsGLM 5 Turbomedium Gemini 2.5 FlashmediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsMiMo-V2-Flashmedium GPT-5.3 ChatnonevsGLM 5 Turbomedium DeepSeek V3.2mediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsQwen3.5-Flashmedium GPT-5.2 ChatnonevsGrok 4.20 Betamedium GPT-5.2 ChatnonevsGLM 5medium GPT-5.2 ChatnonevsStep 3.5 FlashmediumTersedia gratis