Qwen3.7 Plus vs GLM 5.1 (medium)

Empfohlenes Modell Qwen3.7 Plus

Es hat hier die beste Punktzahl (7.2) und kostet etwa 5.0x weniger als GLM 5.1 (medium).

Detaillierter Vergleich

Metrik	Qwen3.7 Plus Qwen3.7 Plus none Veröffentlichung: 2026-06-03	GLM 5.1 GLM 5.1 medium Veröffentlichung: 2026-04-07

Metrik	Qwen3.7 Plus Qwen3.7 Plus none Veröffentlichung: 2026-06-03	GLM 5.1 GLM 5.1 medium Veröffentlichung: 2026-04-07
Punktzahl	7.2	7.1
Rang	#79	#82
Zuverlässigkeit	10.0	8.3
Konsistenz	10.0	8.4
Korrekte Tests
Erfolgsquote pro Versuch	50.0%	69.7%
Instabile Tests	0	4
Gesamtläufe	66	66
Kosten pro Ergebnis	1.014	4.202
Gesamtkosten	$0.106	$0.535
Eingabepreis	$0.320 / 1M	$0.966 / 1M
Ausgabepreis	$1.280 / 1M	$3.036 / 1M
Gesamte Eingabe-Token	98,824	82,623
Ausgabe-Token	58,097	16,089
Denk-Token	0	136,463
Antwortzeit (Durchschnitt)	12.09s	46.77s
Antwortzeit (Maximum)	206.03s	308.75s
Antwortzeit (Gesamt)	265.89s	982.16s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

Ungültiges SVG

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.7 Plus	6.5	10.0	50.0%	0		1.38s	696	349	0
GLM 5.1	10.0	10.0	100.0%	0		8.31s	555	401	5,122

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.7 Plus	5.5	10.0	33.3%	0		2.15s	7,911	639	0
GLM 5.1	4.6	3.7	44.5%	2		109.63s	5,702	4,871	37,826

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.7 Plus	10.0	10.0	100.0%	0		117.70s	71,266	56,024	0
GLM 5.1	9.8	10.0	100.0%	0		175.93s	66,926	4,761	65,248

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.7 Plus	10.0	10.0	100.0%	0		1.43s	7,794	243	0
GLM 5.1	10.0	10.0	100.0%	0		9.33s	7,107	991	4,552

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.7 Plus	3.0	10.0	0.0%	0		868ms	789	18	0
GLM 5.1	5.3	10.0	33.3%	0		29.77s	489	969	11,314

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.7 Plus	5.3	10.0	0.0%	0		1.33s	522	78	0
GLM 5.1	10.0	10.0	100.0%	0		20.95s	477	2,875	2,875

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.7 Plus	6.3	10.0	50.0%	0		929ms	711	72	0
GLM 5.1	6.4	5.8	66.7%	1		7.47s	634	204	1,617

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.7 Plus	7.7	10.0	66.7%	0		1.71s	714	443	0
GLM 5.1	8.2	7.2	88.9%	1		31.64s	609	935	5,730

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.7 Plus	10.0	10.0	100.0%	0		3.54s	8,211	222	0
GLM 5.1	3.0	10.0	0.0%	0		0ms	0	0	0

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.7 Plus	3.0	10.0	0.0%	0		1.21s	210	9	0
GLM 5.1	3.0	10.0	0.0%	0		29.40s	124	82	2,179

Vergleichspaar wechseln