AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Z.ai: GLM 5 Turbo

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-04-24

Metrik	DeepSeek V4 Pro DeepSeek V4 Pro high Veröffentlichung: 2026-04-24	GLM 5 Turbo GLM 5 Turbo medium Veröffentlichung: 2026-03-15

Metrik	DeepSeek V4 Pro DeepSeek V4 Pro high Veröffentlichung: 2026-04-24	GLM 5 Turbo GLM 5 Turbo medium Veröffentlichung: 2026-03-15
Punktzahl	8.2	8.1
Rang	#20	#21
Zuverlässigkeit	k. A.	k. A.
Konsistenz	9.6	8.0
Korrekte Tests
Erfolgsquote pro Versuch	74.1%	77.8%
Instabile Tests	1	5
Gesamtläufe	24	54
Kosten pro Ergebnis	1.224	1.511
Gesamtkosten	$0.160	$0.182
Eingabepreis	$1.740 / 1M	$1.200 / 1M
Ausgabepreis	$3.480 / 1M	$4.000 / 1M
Ausgabe-Token	671	12,197
Denk-Token	39,383	38,933
Antwortzeit (Durchschnitt)	71.21s	17.67s
Antwortzeit (Maximum)	351.99s	194.23s
Antwortzeit (Gesamt)	1281.73s	317.98s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	8.3	10.0	75.0%	0		26.93s	70	2,008
GLM 5 Turbo	10.0	10.0	100.0%	0		4.82s	362	3,137

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	10.0	10.0	100.0%	0		93.00s	82	2,808
GLM 5 Turbo	10.0	10.0	100.0%	0		12.26s	332	3,301

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	10.0	10.0	100.0%	0		71.08s	134	2,163
GLM 5 Turbo	10.0	10.0	100.0%	0		13.88s	390	2,037

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	10.0	10.0	100.0%	0		63.00s	67	1,071
GLM 5 Turbo	10.0	10.0	100.0%	0		6.19s	577	3,632

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	5.3	10.0	33.3%	0		202.56s	11	25,343
GLM 5 Turbo	2.9	4.4	22.2%	2		71.07s	9,665	19,279

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	5.0	10.0	0.0%	0		26.96s	51	734
GLM 5 Turbo	6.1	3.1	66.7%	1		10.05s	60	2,216

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	10.0	10.0	100.0%	0		14.60s	21	1,236
GLM 5 Turbo	10.0	10.0	100.0%	0		5.38s	255	2,183

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	7.6	7.4	77.8%	1		69.69s	151	3,847
GLM 5 Turbo	7.3	5.8	55.6%	2		5.44s	315	2,702

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V4 Pro	10.0	10.0	100.0%	0		11.05s	84	173
GLM 5 Turbo	10.0	10.0	100.0%	0		9.84s	241	446

Schnellvergleich

Vergleichspaar wechseln

DeepSeek V4 ProhighvsQwen3.5-122B-A10Bmedium HY3 PreviewlowKostenlos verfügbarvsGLM 5 Turbomedium Gemini 3 Flash PreviewnonevsGLM 5 Turbomedium DeepSeek V4 ProhighvsQwen3.6 Plusmedium DeepSeek V4 ProhighvsHY3 PreviewlowKostenlos verfügbar DeepSeek V4 ProhighvsGemini 3 Flash Previewnone Gemini 3.1 Flash Lite PreviewlowvsGLM 5 Turbomedium DeepSeek V4 ProhighvsGemini 3.1 Flash Lite Previewlow DeepSeek V4 ProhighvsMiMo-V2.5-Promedium DeepSeek V4 ProhighvsGemini 3.1 Flash Lite Previewmedium DeepSeek V4 ProhighvsMiMo-V2-Promedium DeepSeek V4 ProhighvsGPT-5.4medium