AI BENCHY Compare

Qwen: Qwen3.5-9B vs Z.ai: GLM 4.7 Flash

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-12

Metrică	Qwen3.5-9B Qwen3.5-9B medium Lansare: 2026-03-02	GLM 4.7 Flash GLM 4.7 Flash medium Lansare: 2026-01-19

Metrică	Qwen3.5-9B Qwen3.5-9B medium Lansare: 2026-03-02	GLM 4.7 Flash GLM 4.7 Flash medium Lansare: 2026-01-19
Rang	#66	#62
Scor mediu	2.6	3.1
Consistență	7.4	6.4
Cost per rezultat	0.779	1.040
Cost total	$0.024	$0.042
Teste corecte
Rată de trecere pe încercare	35.4%	41.7%
Teste instabile	5	7
Rulări totale	48	48
Tokenuri de ieșire	17,930	38,682
Tokenuri de raționament	139,706	64,952
Timp de răspuns (mediu)	71.44s	36.84s
Timp de răspuns (maxim)	226.38s	174.55s
Timp de răspuns (total)	928.77s	331.58s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor mediu vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor mediu vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-9B	4.0	7.2	55.6%	1		31.54s	2,410	10,913
GLM 4.7 Flash	4.0	4.5	55.6%	2		27.09s	1,085	5,597

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-9B	10.0	10.0	0.0%	0		0ms	0	0
GLM 4.7 Flash	10.0	2.1	33.3%	1		65.57s	2,585	20,648

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-9B	5.0	5.6	33.3%	1		87.31s	1,383	32,113
GLM 4.7 Flash	5.0	10.0	50.0%	0		1.51s	584	2,755

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-9B	10.0	7.2	22.2%	1		137.75s	11,549	48,475
GLM 4.7 Flash	10.0	4.4	33.3%	2		174.55s	33,000	25,394

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-9B	10.0	1.6	33.3%	1		226.38s	0	30,695
GLM 4.7 Flash	10.0	9.7	0.0%	0		18.14s	18	2,138

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-9B	5.5	5.8	66.7%	1		17.15s	599	4,517
GLM 4.7 Flash	5.0	5.8	66.7%	1		2.97s	388	2,181

Puzzle Solving	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-9B	10.0	10.0	0.0%	0		33.38s	1,545	11,844
GLM 4.7 Flash	10.0	7.2	11.1%	1		12.90s	798	5,225

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-9B	10.0	10.0	100.0%	0		4.31s	444	1,149
GLM 4.7 Flash	10.0	10.0	100.0%	0		15.95s	224	1,014

Comparație rapidă

Schimbă perechea de comparație

Grok 4.1 FastnonevsGLM 4.7 Flashmedium MiMo-V2-FlashnonevsGLM 4.7 Flashmedium Mercury 2nonevsGLM 4.7 Flashmedium Qwen3.5-9BnonevsGLM 4.7 Flashmedium Qwen3.5-9BmediumvsMiMo-V2-Flashnone Nemotron 3 Super 120b A12bnoneDisponibil gratuitvsGLM 4.7 Flashmedium Qwen3.5-9BmediumvsGrok 4.1 Fastnone Mercury 2nonevsQwen3.5-9Bmedium Nemotron 3 Super 120b A12bnoneDisponibil gratuitvsQwen3.5-9Bmedium Qwen3 Coder NextnonevsGLM 4.7 Flashmedium GPT-4o-mininonevsGLM 4.7 Flashmedium Kimi K2.5nonevsGLM 4.7 Flashmedium