AI BENCHY Compare

OpenAI: GPT-5.3-Codex vs Z.ai: GLM 5V Turbo

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-14

Metrică	GPT-5.3-Codex GPT-5.3-Codex medium Lansare: 2026-02-05	GLM 5V Turbo GLM 5V Turbo none Lansare: 2026-04-01

Metrică	GPT-5.3-Codex GPT-5.3-Codex medium Lansare: 2026-02-05	GLM 5V Turbo GLM 5V Turbo none Lansare: 2026-04-01
Scor	8.6	6.2
Rang	#5	#55
Consistență	8.7	10.0
Teste corecte
Rată de trecere pe încercare	83.3%	44.4%
Teste instabile	3	0
Rulări totale	54	54
Cost per rezultat	4.405	0.542
Cost total	$0.573	$0.044
Preț de intrare	$1.750 / 1M	$1.200 / 1M
Preț de ieșire	$14.000 / 1M	$4.000 / 1M
Tokenuri de ieșire	2,279	1,724
Tokenuri de raționament	35,179	0
Timp de răspuns (mediu)	15.38s	3.10s
Timp de răspuns (maxim)	100.93s	6.51s
Timp de răspuns (total)	276.91s	55.87s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.3-Codex	8.7	7.9	91.7%	1		4.16s	240	1,722
GLM 5V Turbo	4.8	10.0	25.0%	0		3.13s	281	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.3-Codex	10.0	10.0	100.0%	0		8.95s	491	1,530
GLM 5V Turbo	10.0	10.0	100.0%	0		5.30s	336	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.3-Codex	10.0	10.0	100.0%	0		19.56s	364	2,731
GLM 5V Turbo	3.0	10.0	0.0%	0		6.51s	276	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.07s	234	728
GLM 5V Turbo	10.0	10.0	100.0%	0		3.81s	204	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.3-Codex	5.9	7.2	55.6%	1		64.31s	64	25,308
GLM 5V Turbo	5.3	10.0	33.3%	0		2.09s	24	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.3-Codex	4.6	10.0	0.0%	0		4.87s	187	331
GLM 5V Turbo	4.6	10.0	0.0%	0		2.22s	114	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.04s	93	693
GLM 5V Turbo	6.5	10.0	50.0%	0		1.97s	60	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.3-Codex	9.0	7.9	88.9%	1		5.12s	352	1,644
GLM 5V Turbo	5.3	10.0	33.3%	0		2.22s	207	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.3-Codex	10.0	10.0	100.0%	0		6.37s	254	492
GLM 5V Turbo	10.0	10.0	100.0%	0		4.86s	222	0

Comparație rapidă

Schimbă perechea de comparație

GPT-5 NanomediumvsGLM 5V Turbonone Gemini 3 Flash PreviewlowvsGPT-5.3-Codexmedium Mercury 2mediumvsGLM 5V Turbonone gpt-oss-120bmediumDisponibil gratuitvsGLM 5V Turbonone Gemini 3 Flash PreviewnonevsGPT-5.3-Codexmedium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.3-Codexmedium Grok 4.1 FastmediumvsGLM 5V Turbonone Nemotron 3 SupermediumDisponibil gratuitvsGLM 5V Turbonone MiniMax M2.5mediumDisponibil gratuitvsGLM 5V Turbonone Mistral Small 4mediumvsGLM 5V Turbonone Gemini 3.1 Flash Lite PreviewnonevsGPT-5.3-Codexmedium Grok 4.20mediumvsGLM 5V Turbonone