AI BENCHY Compare

Qwen: Qwen3.6 27B vs Z.ai: GLM 4.7 Flash

Rezumat

Comparație benchmark Qwen3.6 27B vs GLM 4.7 Flash: Qwen3.6 27B conduce la scorul mediu cu 5.5 vs 4.9. GLM 4.7 Flash are costul de benchmark mai mic, $0.004 vs $0.025. GLM 4.7 Flash este mai rapid cu 2.86s vs 3.72s, cu rate de reușită de 47.6% vs 36.5%.

Model recomandat: Qwen3.6 27B - Are cel mai puternic scor din această comparație (5.5) și cel mai bun echilibru între cost și timp de răspuns dintre toate cele 2 modele.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-02

Metrică	Qwen3.6 27B Qwen3.6 27B none Lansare: 2026-04-20	GLM 4.7 Flash GLM 4.7 Flash none Lansare: 2026-01-19

Metrică	Qwen3.6 27B Qwen3.6 27B none Lansare: 2026-04-20	GLM 4.7 Flash GLM 4.7 Flash none Lansare: 2026-01-19
Scor	5.5	4.9
Rang	#124	#146
Fiabilitate	10.0	10.0
Consistență	7.6	8.8
Teste corecte
Rată de trecere pe încercare	47.6%	36.5%
Teste instabile	6	3
Rulări totale	63	63
Cost per rezultat	0.467	0.056
Cost total	$0.025	$0.004
Preț de intrare	$0.286 / 1M	$0.060 / 1M
Preț de ieșire	$2.400 / 1M	$0.400 / 1M
Total tokenuri de intrare	52,721	38,745
Tokenuri de ieșire	3,812	2,521
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	3.72s	2.86s
Timp de răspuns (maxim)	11.82s	7.05s
Timp de răspuns (total)	78.08s	40.04s

Prezentare generare

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#124 Qwen3.6 27B

none

Cost: $0.009
Timp: 83.0s
Tokenuri: 4,549 tok

#146 GLM 4.7 Flash

none

SVG invalid

Cost: $0.000
Timp: 300.0s
Tokenuri: 0 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	3.8	3.7	41.7%	3		2.83s	696	490	0
GLM 4.7 Flash	5.2	7.9	41.7%	1		5.51s	555	438	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	5.5	10.0	33.3%	0		4.16s	7,913	539	0
GLM 4.7 Flash	4.3	10.0	0.0%	0		2.54s	7,256	650	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	3.0	10.0	0.0%	0		9.95s	22,497	1,401	0
GLM 4.7 Flash	3.0	10.0	0.0%	0		3.22s	14,325	704	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	7.3	5.8	83.3%	1		2.06s	7,788	248	0
GLM 4.7 Flash	7.3	5.8	83.3%	1		4.82s	7,107	196	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	7.7	10.0	66.7%	0		3.03s	789	24	0
GLM 4.7 Flash	7.7	10.0	66.7%	0		744ms	687	19	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	5.2	9.9	0.0%	0		1.07s	522	72	0
GLM 4.7 Flash	4.0	10.0	0.0%	0		1.59s	477	134	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	6.2	5.8	66.7%	1		1.92s	711	49	0
GLM 4.7 Flash	6.5	10.0	50.0%	0		888ms	636	62	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	5.3	7.2	44.4%	1		5.15s	714	639	0
GLM 4.7 Flash	6.4	10.0	33.3%	0		1.20s	609	97	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	9.5	10.0	100.0%	0		6.74s	10,881	339	0
GLM 4.7 Flash	2.8	1.6	33.3%	1		7.05s	6,907	212	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	3.0	10.0	0.0%	0		4.03s	210	11	0
GLM 4.7 Flash	3.0	10.0	0.0%	0		692ms	186	9	0

Comparație rapidă

Schimbă perechea de comparație

CobuddymediumvsGLM 4.7 Flashnone MiniMax M2.5mediumvsGLM 4.7 Flashnone Qwen3 Coder NextmediumvsGLM 4.7 Flashnone Mistral Small 4mediumvsGLM 4.7 Flashnone MiniMax M2.7mediumvsGLM 4.7 Flashnone MiniMax M2.7mediumvsQwen3.6 27Bnone North Mini CodemediumDisponibil gratuitvsQwen3.6 27Bnone Mistral Small 4mediumvsQwen3.6 27Bnone CobuddymediumvsQwen3.6 27Bnone Gemini 3.1 Flash LiteminimalvsQwen3.6 27Bnone MiniMax M2.5mediumvsQwen3.6 27Bnone Gemma 4 31BmediumDisponibil gratuitvsQwen3.6 27Bnone