AI BENCHY Compare

OpenAI: GPT-5.4 Nano vs Z.ai: GLM 5.1

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-30

Metrică	GPT-5.4 Nano GPT-5.4 Nano medium Lansare: 2026-03-17	GLM 5.1 GLM 5.1 medium Lansare: 2026-04-07

Metrică	GPT-5.4 Nano GPT-5.4 Nano medium Lansare: 2026-03-17	GLM 5.1 GLM 5.1 medium Lansare: 2026-04-07
Scor	7.6	7.8
Rang	#50	#45
Fiabilitate	N/D	N/D
Consistență	9.0	8.6
Teste corecte
Rată de trecere pe încercare	68.5%	75.9%
Teste instabile	2	3
Rulări totale	54	54
Cost per rezultat	0.747	1.674
Cost total	$0.083	$0.201
Preț de intrare	$0.200 / 1M	$1.050 / 1M
Preț de ieșire	$1.250 / 1M	$3.500 / 1M
Tokenuri de ieșire	2,946	8,005
Tokenuri de raționament	58,132	49,090
Timp de răspuns (mediu)	11.21s	24.13s
Timp de răspuns (maxim)	94.06s	118.52s
Timp de răspuns (total)	201.80s	410.25s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Nano	8.3	10.0	75.0%	0		4.52s	683	2,254
GLM 5.1	10.0	10.0	100.0%	0		8.31s	401	5,122

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Nano	10.0	10.0	100.0%	0		13.41s	472	3,616
GLM 5.1	4.7	1.6	66.7%	1		118.52s	1,339	13,777

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Nano	9.8	10.0	100.0%	0		24.13s	349	5,719
GLM 5.1	9.5	10.0	100.0%	0		43.11s	327	4,206

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Nano	10.0	10.0	100.0%	0		2.54s	234	516
GLM 5.1	10.0	10.0	100.0%	0		9.33s	991	4,552

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Nano	5.9	7.2	55.6%	1		38.18s	60	43,325
GLM 5.1	5.3	10.0	33.3%	0		29.77s	969	11,314

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Nano	4.5	10.0	0.0%	0		4.15s	179	443
GLM 5.1	10.0	10.0	100.0%	0		20.95s	2,875	2,875

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Nano	9.8	10.0	100.0%	0		1.88s	95	521
GLM 5.1	6.4	5.8	66.7%	1		7.47s	204	1,617

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Nano	4.0	7.1	22.2%	1		3.65s	640	1,356
GLM 5.1	8.2	7.2	88.9%	1		23.85s	899	5,627

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Nano	10.0	10.0	100.0%	0		7.71s	234	382
GLM 5.1	3.0	10.0	0.0%	0		0ms	0	0

Comparație rapidă

Schimbă perechea de comparație

GPT-5.4 NanomediumvsQwen3.6 Max Previewnone DeepSeek V4 FlashhighvsGLM 5.1medium GPT-5.3 ChatnonevsGLM 5.1medium Gemini 3.1 Flash Lite PreviewnonevsGLM 5.1medium GPT-5.2 ChatnonevsGLM 5.1medium Claude Sonnet 4.6nonevsGPT-5.4 Nanomedium Qwen3.6 Max PreviewnonevsGLM 5.1medium DeepSeek V4 FlashhighvsGPT-5.4 Nanomedium Gemini 3.1 Flash Lite PreviewlowvsGLM 5.1medium Gemini 3 Flash PreviewnonevsGLM 5.1medium HY3 PreviewlowDisponibil gratuitvsGLM 5.1medium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.4 Nanomedium