#110

GLM 4.7 Flash

Z.ai Veröffentlichung: 2026-01-19 Getestet am: 2026-05-21 23:41 z-ai/glm-4.7-flash::none

(medium) (none)

Zusammenfassung

GLM 4.7 Flash erreicht 5.6 bei AI BENCHY und liegt auf #110. Das Modell hat 10.0 Zuverlässigkeit, 38.3% Erfolgsrate, $0.004 Gesamtkosten und 2.98s durchschnittliche Antwortzeit.

Was GLM 4.7 Flash besonders macht: Am stärksten ist es in Domänenspezifisch, wo es #1 erreicht; am schwächsten ist Datenanalyse und -extraktion mit #12.

Punktzahl

5.6

Konsistenz

8.7

Zuverlässigkeit

10.0

Gesamtkosten (aktueller Preis)

$0.004

Gesamte Ausgabe-Token

2,516

Gesamte Eingabe-Token

Eingabepreis

$0.060 / 1M

Ausgabepreis

$0.400 / 1M

Korrekte Tests

Falsche Tests: 14

Erfolgsquote pro Versuch: 38.3%

Instabile Tests

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

2.98s

Antwortzeit (Maximum): 7.05s

Antwortzeit (Gesamt): 38.73s

Falsche Antwort: 12 Anweisungen nicht befolgt: 1 Ungültiger Werkzeugaufruf: 1

Generierungs-Showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#110 GLM 4.7 Flash

none

Ungültiges SVG

Kosten: $0.000
Zeit: 300.0s
Token: 0 tok

Testverlauf

Getestet am	Punktzahl	Zuverlässigkeit	Gesamtkosten	Vergleichen
2026-06-04 13:05 Neuer Test hinzugefügt	5.5	10.0	$0.004	Vergleichen
2026-05-21 23:41 Suite geändert	5.6	10.0	$0.004	Aktueller Lauf
2026-04-11 01:19 Erster erfasster Lauf	5.6	k. A.	$0.003	Vergleichen

Dieser Lauf nutzte eine andere Benchmark-Suite. Berücksichtige Suite-Änderungen bei der historischen Einordnung.

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

GLM 4.7 FlashnonevsDeepSeek V4 Flashnone GLM 4.7 FlashnonevsMiMo-V2.5-Pronone GLM 4.7 FlashnonevsGLM 5.1none GLM 4.7 FlashnonevsQwen3.6 27Bnone GLM 4.7 FlashnonevsGemma 4 26B A4BnoneKostenlos verfügbar GLM 4.7 FlashnonevsGemini 3.5 Flashhigh GLM 4.7 FlashnonevsGemini 3 Flash Previewmedium GLM 4.7 FlashnonevsNemotron 3 Ultra 550b A55bmediumKostenlos verfügbar GLM 4.7 FlashnonevsGPT-5.5low

Kategorieaufschlüsselung

Kategorie	Punktzahl	Konsistenz
Anti-KI-Tricks	5.2	7.9
Programmierung	5.0	10.0
Kombiniert	3.0	10.0
Datenanalyse und -extraktion	7.3	5.8
Domänenspezifisch	7.7	10.0
Allgemeine Intelligenz	4.0	10.0
Befolgung von Anweisungen	6.5	10.0
Rätsellösen	6.4	10.0
Werkzeugaufrufe	2.8	1.6
Allgemeinwissen	3.0	10.0

GLM 4.7 Flash

Hamster playing table tennis

#110 GLM 4.7 Flash

Diagramme

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Kategorieaufschlüsselung

Verglichene Modelle