AI BENCHY Compare

OpenAI: GPT-5.4 vs Z.ai: GLM 5 Turbo

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-01

Metrică	GPT-5.4 GPT-5.4 medium Lansare: 2026-03-05	GLM 5 Turbo GLM 5 Turbo medium Lansare: 2026-03-15

Metrică	GPT-5.4 GPT-5.4 medium Lansare: 2026-03-05	GLM 5 Turbo GLM 5 Turbo medium Lansare: 2026-03-15
Scor	8.2	8.1
Rang	#23	#25
Fiabilitate	N/D	N/D
Consistență	8.7	8.0
Teste corecte
Rată de trecere pe încercare	79.6%	77.8%
Teste instabile	3	5
Rulări totale	54	54
Cost per rezultat	6.399	1.511
Cost total	$0.832	$0.182
Preț de intrare	$2.500 / 1M	$1.200 / 1M
Preț de ieșire	$15.000 / 1M	$4.000 / 1M
Tokenuri de ieșire	2,169	12,197
Tokenuri de raționament	48,732	38,933
Timp de răspuns (mediu)	18.63s	17.67s
Timp de răspuns (maxim)	100.41s	194.23s
Timp de răspuns (total)	335.26s	317.98s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	8.3	10.0	75.0%	0		4.11s	240	1,511
GLM 5 Turbo	10.0	10.0	100.0%	0		4.82s	362	3,137

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	10.0	10.0	100.0%	0		13.03s	389	2,045
GLM 5 Turbo	10.0	10.0	100.0%	0		12.26s	332	3,301

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	10.0	10.0	100.0%	0		20.57s	301	3,543
GLM 5 Turbo	10.0	10.0	100.0%	0		13.88s	390	2,037

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	10.0	10.0	100.0%	0		5.32s	234	804
GLM 5 Turbo	10.0	10.0	100.0%	0		6.19s	577	3,632

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	5.3	7.2	44.4%	1		74.27s	61	34,748
GLM 5 Turbo	2.9	4.4	22.2%	2		71.07s	9,665	19,279

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	4.7	3.1	33.3%	1		4.92s	145	321
GLM 5 Turbo	6.1	3.1	66.7%	1		10.05s	60	2,216

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	10.0	10.0	100.0%	0		3.11s	93	897
GLM 5 Turbo	10.0	10.0	100.0%	0		5.38s	255	2,183

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	8.2	7.2	88.9%	1		9.13s	442	3,832
GLM 5 Turbo	7.3	5.8	55.6%	2		5.44s	315	2,702

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	10.0	10.0	100.0%	0		13.28s	264	1,031
GLM 5 Turbo	10.0	10.0	100.0%	0		9.84s	241	446

Comparație rapidă

Schimbă perechea de comparație

HY3 PreviewlowDisponibil gratuitvsGLM 5 Turbomedium Gemini 3 Flash PreviewnonevsGLM 5 Turbomedium Gemini 3.1 Flash Lite PreviewlowvsGLM 5 Turbomedium GPT-5.4mediumvsHY3 PreviewlowDisponibil gratuit Gemini 3 Flash PreviewnonevsGPT-5.4medium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.4medium GPT-5.2 ChatnonevsGLM 5 Turbomedium Gemini 3.1 Flash Lite PreviewnonevsGLM 5 Turbomedium GPT-5.3 ChatnonevsGLM 5 Turbomedium DeepSeek V4 FlashhighvsGLM 5 Turbomedium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.4medium DeepSeek V4 FlashhighvsGPT-5.4medium