Navigation
AI BENCHY
Vergleichen Diagramme Methodik
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 vs Z.ai: GLM 5

Vergleichen:

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-03-06

Metrik OpenAI: GPT-5.4 medium Veröffentlichung: 2026-03-05 Z.ai: GLM 5 none Veröffentlichung: 2026-02-12
Rang #9 #31
Ø-Score 8.0 6.0
Konsistenz 8.5 10.0
Kosten pro Ergebnis 6.601 0.200
Gesamtkosten $0.793 $0.018
Korrekte Tests
Erfolgsquote pro Versuch 83.3% 56.3%
Instabile Tests 3 0
Gesamtläufe 48 (16 x 3) 48 (16 x 3)
Ausgabe-Token 1,756 1,548
Denk-Token 46,642 0
Antwortzeit (Durchschnitt) 20.05s 4.03s
Antwortzeit (Maximum) 100.41s 11.07s
Antwortzeit (Gesamt) 320.87s 36.30s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Ø-Score vs Antwortzeit (Durchschnitt)

Kategorieaufschlüsselung

Anti-KI-Tricks Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 5.02s 216 1,466
Z.ai: GLM 5 4.0 10.0 33.3% 0 3.39s 272 0
Kombiniert Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
Z.ai: GLM 5 10.0 10.0 0.0% 0 4.98s 406 0
Datenanalyse und -extraktion Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 5.32s 234 804
Z.ai: GLM 5 9.9 10.0 100.0% 0 5.78s 203 0
Domänenspezifisch Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 74.27s 61 34,748
Z.ai: GLM 5 10.0 10.0 0.0% 0 2.24s 19 0
Allgemeine Intelligenz Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
OpenAI: GPT-5.4 5.0 3.1 33.3% 1 4.92s 145 321
Z.ai: GLM 5 10.0 10.0 100.0% 0 3.27s 103 0
Befolgung von Anweisungen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Z.ai: GLM 5 10.0 10.0 100.0% 0 1.48s 61 0
Puzzle Solving Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
OpenAI: GPT-5.4 7.0 7.2 88.9% 1 9.13s 442 3,832
Z.ai: GLM 5 7.0 10.0 66.7% 0 2.05s 264 0
Werkzeugaufrufe Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
Z.ai: GLM 5 10.0 10.0 100.0% 0 11.07s 220 0

Schnellvergleich

Vergleichspaar wechseln