AI BENCHY Compare

Qwen: Qwen3.5-122B-A10B vs Z.ai: GLM 4.7 Flash

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-01

Metrică	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Lansare: 2026-02-24	GLM 4.7 Flash GLM 4.7 Flash medium Lansare: 2026-01-19

Metrică	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Lansare: 2026-02-24	GLM 4.7 Flash GLM 4.7 Flash medium Lansare: 2026-01-19
Scor	5.4	4.5
Rang	#131	#155
Fiabilitate	10.0	10.0
Consistență	9.5	6.7
Teste corecte
Rată de trecere pe încercare	33.3%	35.0%
Teste instabile	1	8
Rulări totale	60	60
Cost per rezultat	0.380	1.337
Cost total	$0.019	$0.054
Preț de intrare	$0.260 / 1M	$0.060 / 1M
Preț de ieșire	$2.080 / 1M	$0.400 / 1M
Tokenuri de ieșire	3,374	43,754
Tokenuri de raționament	0	89,079
Timp de răspuns (mediu)	3.38s	35.10s
Timp de răspuns (maxim)	46.00s	174.55s
Timp de răspuns (total)	67.55s	456.24s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-122B-A10B	4.8	10.0	25.0%	0		1.59s	312	0
GLM 4.7 Flash	4.7	5.9	41.7%	2		14.95s	1,122	6,110

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-122B-A10B	4.0	5.5	33.3%	1		2.14s	684	0
GLM 4.7 Flash	3.4	6.0	16.7%	1		55.33s	4,981	22,387

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		46.00s	1,137	0
GLM 4.7 Flash	2.8	2.1	33.3%	1		65.57s	2,585	20,648

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		1.01s	243	0
GLM 4.7 Flash	6.3	10.0	50.0%	0		1.51s	584	2,755

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-122B-A10B	5.3	10.0	33.3%	0		465ms	15	0
GLM 4.7 Flash	3.5	4.4	33.3%	2		174.55s	33,000	25,394

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-122B-A10B	5.0	10.0	0.0%	0		1.12s	66	0
GLM 4.7 Flash	3.6	9.7	0.0%	0		18.14s	18	2,138

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-122B-A10B	6.3	10.0	50.0%	0		513ms	69	0
GLM 4.7 Flash	6.2	5.8	66.7%	1		2.97s	388	2,181

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-122B-A10B	3.8	10.0	0.0%	0		1.00s	575	0
GLM 4.7 Flash	2.9	7.2	11.1%	1		12.93s	781	5,255

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		2.04s	264	0
GLM 4.7 Flash	10.0	10.0	100.0%	0		15.95s	224	1,014

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		295ms	9	0
GLM 4.7 Flash	3.0	10.0	0.0%	0		11.13s	71	1,197

Comparație rapidă

Schimbă perechea de comparație

Ling-2.6-1TnonevsGLM 4.7 Flashmedium MiniMax M2.7mediumvsQwen3.5-122B-A10Bnone Elephant AlphamediumvsQwen3.5-122B-A10Bnone Mistral Small 4mediumvsQwen3.5-122B-A10Bnone MiniMax M2.5mediumvsQwen3.5-122B-A10Bnone Mercury 2nonevsGLM 4.7 Flashmedium MiMo-V2-FlashnonevsGLM 4.7 Flashmedium Qwen3.5-9BnonevsGLM 4.7 Flashmedium GPT-5.4 NanononevsGLM 4.7 Flashmedium Trinity Large PreviewnonevsGLM 4.7 Flashmedium Granite 4.1 8BnonevsGLM 4.7 Flashmedium CobuddymediumvsQwen3.5-122B-A10Bnone