Compară Grafice

Limbă:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-5.4 vs Z.ai: GLM 4.7 Flash

Compară:

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-05

Metrică	OpenAI: GPT-5.4 none Lansare: 2026-03-05	Z.ai: GLM 4.7 Flash medium Lansare: 2026-01-19
Rang	#44	#52
Scor mediu	4.6	3.3
Teste corecte
Consistență	8.9	6.1
Cost per rezultat	1.496	1.018
Cost total	$0.090	$0.041
Rată de trecere pe încercare	44.4%	44.4%
Teste instabile	2	7
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
Tokenuri de ieșire	1,635	38,664
Tokenuri de raționament	0	62,814
Timp de răspuns (medie)	1.46s	39.18s
Timp de răspuns (maxim)	2.89s	174.55s
Timp de răspuns (total)	21.86s	313.44s

Top modele după scor

Timp de răspuns (medie)

Scor vs cost total

Scor mediu vs Timp de răspuns (medie)

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (medie)	Tokenuri de ieșire	Tokenuri de raționament
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0
Z.ai: GLM 4.7 Flash	4.0	4.5	55.6%	2		27.09s	1,085	5,597

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (medie)	Tokenuri de ieșire	Tokenuri de raționament
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0
Z.ai: GLM 4.7 Flash	10.0	2.1	33.3%	1		65.57s	2,585	20,648

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (medie)	Tokenuri de ieșire	Tokenuri de raționament
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0
Z.ai: GLM 4.7 Flash	5.0	10.0	50.0%	0		1.51s	584	2,755

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (medie)	Tokenuri de ieșire	Tokenuri de raționament
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0
Z.ai: GLM 4.7 Flash	10.0	4.4	33.3%	2		174.55s	33,000	25,394

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (medie)	Tokenuri de ieșire	Tokenuri de raționament
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0
Z.ai: GLM 4.7 Flash	5.0	5.8	66.7%	1		2.97s	388	2,181

Puzzle Solving	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (medie)	Tokenuri de ieșire	Tokenuri de raționament
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0
Z.ai: GLM 4.7 Flash	10.0	7.2	11.1%	1		12.90s	798	5,225

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (medie)	Tokenuri de ieșire	Tokenuri de raționament
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0
Z.ai: GLM 4.7 Flash	10.0	10.0	100.0%	0		15.95s	224	1,014

Comparație rapidă

Schimbă perechea de comparație

Mercury 2nonevsGLM 4.7 Flashmedium MiniMax M2.5mediumvsGPT-5.4none Qwen3 Coder NextnonevsGLM 4.7 Flashmedium Grok 4.1 FastnonevsGLM 4.7 Flashmedium Kimi K2.5nonevsGLM 4.7 Flashmedium MiMo-V2-FlashnonevsGLM 4.7 Flashmedium LFM2-24B-A2BnonevsGLM 4.7 Flashmedium GPT-4o-mininonevsGLM 4.7 Flashmedium Mercury 2mediumvsGPT-5.4none Trinity Large Preview (free)noneDisponibil gratuitvsGLM 4.7 Flashmedium GPT-5.4nonevsQwen3.5-35B-A3Bmedium GPT-5.4nonevsQwen3 Coder Nextmedium