AI BENCHY Compare

Qwen: Qwen3.6 27B vs Z.ai: GLM 5V Turbo

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-04-27

Metrik	Qwen3.6 27B Qwen3.6 27B none Veröffentlichung: 2026-04-20	GLM 5V Turbo GLM 5V Turbo none Veröffentlichung: 2026-04-01

Metrik	Qwen3.6 27B Qwen3.6 27B none Veröffentlichung: 2026-04-20	GLM 5V Turbo GLM 5V Turbo none Veröffentlichung: 2026-04-01
Punktzahl	6.0	6.2
Rang	#81	#75
Zuverlässigkeit	10.0	k. A.
Konsistenz	7.2	10.0
Korrekte Tests
Erfolgsquote pro Versuch	55.6%	44.4%
Instabile Tests	6	0
Gesamtläufe	54	54
Kosten pro Ergebnis	0.433	0.542
Gesamtkosten	$0.031	$0.044
Eingabepreis	$0.500 / 1M	$1.200 / 1M
Ausgabepreis	$2.000 / 1M	$4.000 / 1M
Ausgabe-Token	3,775	1,724
Denk-Token	0	0
Antwortzeit (Durchschnitt)	4.00s	3.10s
Antwortzeit (Maximum)	12.08s	6.51s
Antwortzeit (Gesamt)	72.01s	55.87s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3.6 27B	3.8	3.7	41.7%	3		2.83s	490	0
GLM 5V Turbo	4.8	10.0	25.0%	0		3.13s	281	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3.6 27B	10.0	10.0	100.0%	0		10.18s	505	0
GLM 5V Turbo	10.0	10.0	100.0%	0		5.30s	336	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3.6 27B	3.0	10.0	0.0%	0		9.95s	1,401	0
GLM 5V Turbo	3.0	10.0	0.0%	0		6.51s	276	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3.6 27B	7.3	5.8	83.3%	1		2.06s	248	0
GLM 5V Turbo	10.0	10.0	100.0%	0		3.81s	204	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3.6 27B	7.7	10.0	66.7%	0		3.03s	24	0
GLM 5V Turbo	5.3	10.0	33.3%	0		2.09s	24	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3.6 27B	5.2	9.9	0.0%	0		1.07s	72	0
GLM 5V Turbo	4.6	10.0	0.0%	0		2.22s	114	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3.6 27B	6.2	5.8	66.7%	1		1.92s	49	0
GLM 5V Turbo	6.5	10.0	50.0%	0		1.97s	60	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3.6 27B	5.3	7.2	44.4%	1		5.24s	647	0
GLM 5V Turbo	5.3	10.0	33.3%	0		2.22s	207	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3.6 27B	9.5	10.0	100.0%	0		6.74s	339	0
GLM 5V Turbo	10.0	10.0	100.0%	0		4.86s	222	0

Schnellvergleich

Vergleichspaar wechseln

GPT-5 NanomediumvsGLM 5V Turbonone gpt-oss-120bmediumKostenlos verfügbarvsQwen3.6 27Bnone GPT-5 NanomediumvsQwen3.6 27Bnone Mercury 2mediumvsGLM 5V Turbonone MiniMax M2.5mediumKostenlos verfügbarvsQwen3.6 27Bnone gpt-oss-120bmediumKostenlos verfügbarvsGLM 5V Turbonone Mistral Small 4mediumvsQwen3.6 27Bnone Mercury 2mediumvsQwen3.6 27Bnone Grok 4.1 FastmediumvsGLM 5V Turbonone Nemotron 3 SupermediumKostenlos verfügbarvsGLM 5V Turbonone MiniMax M2.5mediumKostenlos verfügbarvsGLM 5V Turbonone Mistral Small 4mediumvsGLM 5V Turbonone