Compară Grafice

Limbă:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-5.4 vs Z.ai: GLM 4.7 Flash

Compară:

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-05

Metrică	OpenAI: GPT-5.4 none Lansare: 2026-03-05	Z.ai: GLM 4.7 Flash none Lansare: 2026-01-19
Rang	#44	#47
Scor mediu	4.6	3.9
Teste corecte
Consistență	8.9	8.3
Cost per rezultat	1.496	0.064
Cost total	$0.090	$0.003
Rată de trecere pe încercare	44.4%	37.8%
Teste instabile	2	3
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
Tokenuri de ieșire	1,635	1,721
Tokenuri de raționament	0	0
Timp de răspuns (medie)	1.46s	3.16s
Timp de răspuns (maxim)	2.89s	7.05s
Timp de răspuns (total)	21.86s	25.31s

Top modele după scor

Timp de răspuns (medie)

Scor vs cost total

Scor mediu vs Timp de răspuns (medie)

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (medie)	Tokenuri de ieșire	Tokenuri de raționament
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0
Z.ai: GLM 4.7 Flash	10.0	7.2	22.2%	1		6.59s	430	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (medie)	Tokenuri de ieșire	Tokenuri de raționament
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0
Z.ai: GLM 4.7 Flash	10.0	10.0	0.0%	0		3.22s	704	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (medie)	Tokenuri de ieșire	Tokenuri de raționament
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0
Z.ai: GLM 4.7 Flash	5.4	5.8	83.3%	1		4.82s	196	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (medie)	Tokenuri de ieșire	Tokenuri de raționament
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0
Z.ai: GLM 4.7 Flash	7.0	10.0	66.7%	0		744ms	19	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (medie)	Tokenuri de ieșire	Tokenuri de raționament
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0
Z.ai: GLM 4.7 Flash	5.5	10.0	50.0%	0		888ms	62	0

Puzzle Solving	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (medie)	Tokenuri de ieșire	Tokenuri de raționament
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0
Z.ai: GLM 4.7 Flash	3.7	10.0	0.0%	0		1.00s	98	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (medie)	Tokenuri de ieșire	Tokenuri de raționament
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0
Z.ai: GLM 4.7 Flash	10.0	1.6	33.3%	1		7.05s	212	0

Comparație rapidă

Schimbă perechea de comparație

MiniMax M2.5mediumvsGPT-5.4none Qwen3 Coder NextmediumvsGLM 4.7 Flashnone Mercury 2mediumvsGPT-5.4none MiniMax M2.5mediumvsGLM 4.7 Flashnone GPT-5.4nonevsQwen3.5-35B-A3Bmedium GPT-5.4nonevsQwen3 Coder Nextmedium GPT-5.4nonevsGLM 4.7 Flashmedium gpt-oss-120bmediumDisponibil gratuitvsGLM 4.7 Flashnone Mercury 2mediumvsGLM 4.7 Flashnone GPT-5 NanomediumvsGLM 4.7 Flashnone Claude Opus 4.6mediumvsGPT-5.4none Kimi K2.5mediumvsGPT-5.4none