AI BENCHY Compare

Laguna Xs.2 vs Z.ai: GLM 4.7 Flash

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-04-29

Metrik	Laguna Xs.2 Laguna Xs.2 medium Veröffentlichung: 2026-04-28 Kostenlos verfügbar	GLM 4.7 Flash GLM 4.7 Flash none Veröffentlichung: 2026-01-19

Metrik	Laguna Xs.2 Laguna Xs.2 medium Veröffentlichung: 2026-04-28 Kostenlos verfügbar	GLM 4.7 Flash GLM 4.7 Flash none Veröffentlichung: 2026-01-19
Punktzahl	6.2	5.6
Rang	#80	#97
Zuverlässigkeit	10.0	k. A.
Konsistenz	6.9	8.6
Korrekte Tests
Erfolgsquote pro Versuch	57.4%	37.0%
Instabile Tests	7	3
Gesamtläufe	54	54
Kosten pro Ergebnis	0.000	0.059
Gesamtkosten	$0.000	$0.003
Eingabepreis	$0.000 / 1M	$0.060 / 1M
Ausgabepreis	$0.000 / 1M	$0.400 / 1M
Ausgabe-Token	58,141	2,489
Denk-Token	0	0
Antwortzeit (Durchschnitt)	6.03s	3.35s
Antwortzeit (Maximum)	29.11s	7.05s
Antwortzeit (Gesamt)	108.59s	36.90s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Laguna Xs.2	7.4	5.9	83.3%	2		2.60s	5,283	0
GLM 4.7 Flash	5.2	7.9	41.7%	1		5.51s	438	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Laguna Xs.2	6.3	3.7	33.3%	1		14.36s	7,896	0
GLM 4.7 Flash	6.4	9.9	0.0%	0		5.57s	626	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Laguna Xs.2	3.0	10.0	0.0%	0		15.92s	8,501	0
GLM 4.7 Flash	3.0	10.0	0.0%	0		3.22s	704	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Laguna Xs.2	7.1	5.6	83.3%	1		9.34s	10,472	0
GLM 4.7 Flash	7.3	5.8	83.3%	1		4.82s	196	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Laguna Xs.2	4.1	4.4	44.5%	2		11.12s	18,712	0
GLM 4.7 Flash	7.7	10.0	66.7%	0		744ms	19	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Laguna Xs.2	4.1	10.0	0.0%	0		2.76s	1,421	0
GLM 4.7 Flash	4.0	10.0	0.0%	0		1.59s	134	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Laguna Xs.2	10.0	10.0	100.0%	0		1.68s	1,517	0
GLM 4.7 Flash	6.5	10.0	50.0%	0		888ms	62	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Laguna Xs.2	5.3	10.0	33.3%	0		2.12s	3,168	0
GLM 4.7 Flash	4.4	10.0	0.0%	0		1.00s	98	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Laguna Xs.2	4.7	1.6	66.7%	1		3.39s	1,171	0
GLM 4.7 Flash	2.8	1.6	33.3%	1		7.05s	212	0

Schnellvergleich

Vergleichspaar wechseln

Gemini 2.5 FlashnonevsLaguna Xs.2mediumKostenlos verfügbar Seed-2.0-LitenonevsLaguna Xs.2mediumKostenlos verfügbar Gemma 4 26B A4BnoneKostenlos verfügbarvsLaguna Xs.2mediumKostenlos verfügbar Laguna Xs.2mediumKostenlos verfügbarvsQwen3.5-35B-A3Bnone Laguna Xs.2mediumKostenlos verfügbarvsQwen3.5-Flashnone Laguna Xs.2mediumKostenlos verfügbarvsGLM 5V Turbonone Mistral Small 4mediumvsGLM 4.7 Flashnone DeepSeek V4 PrononevsLaguna Xs.2mediumKostenlos verfügbar MiniMax M2.5mediumKostenlos verfügbarvsGLM 4.7 Flashnone Laguna Xs.2mediumKostenlos verfügbarvsQwen3.6 27Bnone DeepSeek V3.2nonevsLaguna Xs.2mediumKostenlos verfügbar Laguna Xs.2mediumKostenlos verfügbarvsMiMo-V2-Pronone