Compară Grafice

Limbă:

❤️ Made by XCS

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs Z.ai: GLM 4.7 Flash

Nume model:

Benchmark-urile au fost generate din suitele de teste AI BENCHY la : 2026-02-27 15:16

Rezumat

Metrică	Anthropic: Claude Sonnet 4.6 medium Lansare: Data lansării necunoscută	Z.ai: GLM 4.7 Flash medium Lansare: Data lansării necunoscută
Rang	#8	#31
Scor	7.43	4.14
Consistență	9.40	6.42
Cost per rezultat	8.105	0.227
Cost total	$0.811	$0.012
Teste corecte
Teste greșite	4	9
Rată de trecere pe încercare	73.8%	52.4%
Teste instabile	1	6
Tokenuri de ieșire	29,098	8,003
Tokenuri de raționament	20,435	22,680

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Anthropic: Claude Sonnet 4.6	7.00	10.00	66.7%	0		1,031	1,093
Z.ai: GLM 4.7 Flash	4.00	4.48	55.6%	2		1,085	5,597

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Anthropic: Claude Sonnet 4.6	10.00	10.00	100.0%	0		727	907
Z.ai: GLM 4.7 Flash	10.00	10.00	100.0%	0		1,073	4,920

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Anthropic: Claude Sonnet 4.6	1.00	7.21	11.1%	1		25,790	16,919
Z.ai: GLM 4.7 Flash	1.00	4.41	33.3%	2		4,499	4,743

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Anthropic: Claude Sonnet 4.6	10.00	10.00	100.0%	0		316	523
Z.ai: GLM 4.7 Flash	5.00	5.81	66.7%	1		380	2,141

Puzzle Solving	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Anthropic: Claude Sonnet 4.6	10.00	10.00	100.0%	0		579	642
Z.ai: GLM 4.7 Flash	1.00	7.20	11.1%	1		742	4,265

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Anthropic: Claude Sonnet 4.6	10.00	10.00	100.0%	0		655	351
Z.ai: GLM 4.7 Flash	10.00	10.00	100.0%	0		224	1,014

Schimbă perechea de comparație

Compară Anthropic: Claude Sonnet 4.6 cu...

Compară Z.ai: GLM 4.7 Flash cu...