AI BENCHY
Vergleichen
❤️ Made by XCS

Modellname

Z.ai: GLM 5

Benchmarks aus Aibenchy-Test-Suites generiert am : 19.02.2026

Metrik Z.ai: GLM 5
Rang#7
UnternehmenZ.ai
Score 6.83
Konsistenz 7.86
Kosten pro Ergebnis 1.3424
Gesamtkosten $0.10740
Korrekte Tests 8/12
Erfolgsquote pro Versuch 80.6%
Instabile Tests 3
Ausgabe-Token 15,716
Denk-Token 39,675

Kategorieaufschlüsselung

Kategorie Vollständig bestandene Tests Score Konsistenz Erfolgsquote pro Versuch Instabile Tests Begründungswert Kosten
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 9.75 $0.00716
Data parsing and extraction 1/2 5.00 5.56 83.3% 1 9.80 $0.01455
Domain specific 0/3 1.00 4.41 33.3% 2 8.43 $0.06348
Instructions following 2/2 9.50 9.99 100.0% 0 9.75 $0.00754
Puzzle Solving 3/3 10.00 10.00 100.0% 0 9.50 $0.01469

Verglichene Modelle

Z.ai: GLM 5 vergleichen mit...

#6 · Anthropic

Anthropic: Claude Sonnet 4.6

Schlussfolgern (medium)

Score: 7.00

Konsistenz: 9.30

Erfolgsquote pro Versuch: 69.4%

Instabile Tests: 1

Kosten pro Ergebnis: 9.3797

Korrekte Tests: 8/12

Gesamtkosten: $0.75038

Vergleichen

#8 · X Ai

xAI: Grok 4.1 Fast

Schlussfolgern (medium)

Score: 6.42

Konsistenz: 8.60

Erfolgsquote pro Versuch: 66.7%

Instabile Tests: 2

Kosten pro Ergebnis: 0.4800

Korrekte Tests: 7/12

Gesamtkosten: $0.03360

Vergleichen

#5 · OpenAI

OpenAI: GPT-5.2

Schlussfolgern (medium)

Score: 7.92

Konsistenz: 9.30

Erfolgsquote pro Versuch: 80.6%

Instabile Tests: 1

Kosten pro Ergebnis: 2.2838

Korrekte Tests: 9/12

Gesamtkosten: $0.20554

Vergleichen

Schnellvergleich

Z.ai: GLM 5 vergleichen mit...