AI BENCHY Compare

Google: Gemini 3.5 Flash vs Z.ai: GLM 5.2

Ringkasan

Perbandingan benchmark Gemini 3.5 Flash vs GLM 5.2: GLM 5.2 unggul dalam skor rata-rata dengan 7.1 vs 7.0. GLM 5.2 memiliki biaya benchmark lebih rendah di $0.051 vs $1.079. GLM 5.2 lebih cepat di 6.34s vs 9.93s, dengan tingkat keberhasilan 77.8% vs 60.3%.

Model yang direkomendasikan: GLM 5.2 - It has the best score here (7.1), while costing about 21.4x less than Gemini 3.5 Flash.

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-07-02

Metrik	Gemini 3.5 Flash Gemini 3.5 Flash none Rilis: 2026-05-19	GLM 5.2 GLM 5.2 none Rilis: 2026-06-17

Metrik	Gemini 3.5 Flash Gemini 3.5 Flash none Rilis: 2026-05-19	GLM 5.2 GLM 5.2 none Rilis: 2026-06-17
Skor	7.0	7.1
Peringkat	#69	#63
Keandalan	10.0	9.9
Konsistensi	8.9	9.6
Tes benar
Tingkat lulus per percobaan	77.8%	60.3%
Tes tidak stabil	3	1
Total Run	63	63
Biaya per hasil	7.190	0.628
Total Biaya	$1.079	$0.051
Harga input	$1.500 / 1M	$0.930 / 1M
Harga output	$9.000 / 1M	$3.000 / 1M
Total token input	13,843	38,671
Token output	117,518	4,817
Token penalaran	0	0
Waktu respons (rata-rata)	9.93s	6.34s
Waktu respons (maks)	64.36s	20.69s
Waktu respons (total)	178.68s	133.19s

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#69 Gemini 3.5 Flash

none

Biaya: $0.225
Waktu: 125.5s
Token: 25,004 tok

#63 GLM 5.2

none

SVG tidak valid

Biaya: $0.033
Waktu: 87.7s
Token: 7,455 tok

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.53s	492	5,101	0
GLM 5.2	8.3	10.0	75.0%	0		3.70s	567	313	0

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	8.8	7.8	88.9%	1		34.69s	8,122	75,927	0
GLM 5.2	3.7	9.5	0.0%	0		7.55s	7,263	1,958	0

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0
GLM 5.2	10.0	10.0	100.0%	0		20.69s	14,296	1,489	0

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	6.5	10.0	50.0%	0		8.10s	2,781	5,895	0
GLM 5.2	10.0	10.0	100.0%	0		7.17s	7,113	204	0

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	7.6	7.2	77.8%	1		10.64s	633	17,910	0
GLM 5.2	5.3	10.0	33.3%	0		6.50s	696	27	0

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.46s	486	1,620	0
GLM 5.2	6.1	3.1	66.7%	1		4.42s	480	82	0

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	9.8	10.0	100.0%	0		3.38s	615	3,928	0
GLM 5.2	9.8	10.0	100.0%	0		3.84s	642	66	0

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.13s	558	4,640	0
GLM 5.2	7.7	10.0	66.7%	0		3.31s	618	265	0

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0
GLM 5.2	10.0	10.0	100.0%	0		15.76s	6,807	400	0

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	2.8	1.6	33.3%	1		4.87s	156	2,497	0
GLM 5.2	3.0	10.0	0.0%	0		3.41s	189	13	0

Perbandingan Cepat

Ganti Pasangan Perbandingan

Gemini 3.5 FlashnonevsKimi K2.7 Codemedium Gemma 4 26B A4BmediumTersedia gratisvsGLM 5.2none Step 3.7 FlashhighvsGLM 5.2none Gemini 3.5 FlashnonevsLaguna XS 2.1mediumTersedia gratis Laguna XS 2.1mediumTersedia gratisvsGLM 5.2none Gemini 3.5 FlashnonevsGLM 5.1medium Gemini 3.5 FlashnonevsStep 3.7 Flashhigh Kimi K2.7 CodemediumvsGLM 5.2none Gemini 3.5 FlashnonevsQwen3.5-Flashmedium Gemini 3.5 FlashnonevsRing-2.6-1Tmedium Grok 4.20mediumvsGLM 5.2none Gemini 3 Flash PreviewlowvsGLM 5.2none