AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Z.ai: GLM 5

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-29

Metrică	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Lansare: 2026-02-19	GLM 5 GLM 5 medium Lansare: 2026-02-12

Metrică	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Lansare: 2026-02-19	GLM 5 GLM 5 medium Lansare: 2026-02-12
Scor	9.3	8.2
Rang	#4	#20
Fiabilitate	10.0	10.0
Consistență	10.0	8.4
Teste corecte
Rată de trecere pe încercare	90.0%	81.7%
Teste instabile	0	4
Rulări totale	60	60
Cost per rezultat	5.587	1.676
Cost total	$1.006	$0.235
Preț de intrare	$2.000 / 1M	$0.600 / 1M
Preț de ieșire	$12.000 / 1M	$1.920 / 1M
Tokenuri de ieșire	1,971	21,558
Tokenuri de raționament	75,384	95,772
Timp de răspuns (mediu)	20.77s	32.67s
Timp de răspuns (maxim)	88.68s	99.85s
Timp de răspuns (total)	269.96s	392.01s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	112	3,218
GLM 5	10.0	10.0	100.0%	0		23.66s	480	7,056

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	7.0	9.8	50.0%	0		54.28s	429	37,735
GLM 5	10.0	10.0	100.0%	0		89.47s	2,985	45,706

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	432	9,281
GLM 5	10.0	10.0	100.0%	0		28.96s	662	3,242

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	279	3,904
GLM 5	7.1	5.6	83.3%	1		8.90s	567	3,734

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	18	12,424
GLM 5	3.5	4.4	33.3%	2		0ms	13,176	14,137

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179
GLM 5	6.1	3.1	66.7%	1		14.69s	2,020	2,248

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236
GLM 5	10.0	10.0	100.0%	0		7.25s	1,001	2,129

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.90s	235	3,128
GLM 5	10.0	10.0	100.0%	0		11.33s	33	4,076

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982
GLM 5	10.0	10.0	100.0%	0		15.93s	233	994

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.27s	12	1,297
GLM 5	3.0	10.0	0.0%	0		67.37s	401	12,450

Comparație rapidă

Schimbă perechea de comparație

Gemini 3.5 FlashminimalvsGLM 5medium Qwen3.7 MaxnonevsGLM 5medium GPT-5.2 ChatnonevsGLM 5medium Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Gemini 3 Flash PreviewlowvsGLM 5medium Gemini 3 Flash PreviewnonevsGLM 5medium DeepSeek V4 FlashhighDisponibil gratuitvsGLM 5medium Gemini 3.1 Flash Lite PreviewlowvsGLM 5medium Gemini 3.5 FlashnonevsGLM 5medium GPT-5.5lowvsGLM 5medium Gemini 3.1 Flash Lite PreviewnonevsGLM 5medium Gemini 3.1 Flash LitelowvsGLM 5medium