AI BENCHY
Vergleichen
❤️ Made by XCS

Modellname

Z.ai: GLM 4.7 Flash

Benchmarks aus Aibenchy-Test-Suites generiert am : 19.02.2026

Metrik Z.ai: GLM 4.7 Flash
Rang#23
UnternehmenZ.ai
Score 3.25
Konsistenz 8.75
Kosten pro Ergebnis 0.0351
Gesamtkosten $0.00071
Korrekte Tests 2/12
Erfolgsquote pro Versuch 27.8%
Instabile Tests 2
Ausgabe-Token 399
Denk-Token 0

Kategorieaufschlüsselung

Kategorie Vollständig bestandene Tests Score Konsistenz Erfolgsquote pro Versuch Instabile Tests Begründungswert Kosten
Anti-AI Tricks 0/2 1.00 10.00 0.0% 0 - $0.00003
Data parsing and extraction 0/2 0.50 5.81 33.3% 1 - $0.00050
Domain specific 2/3 7.00 10.00 66.7% 0 - $0.00005
Instructions following 0/2 4.00 6.84 33.3% 1 - $0.00006
Puzzle Solving 0/3 2.33 9.91 0.0% 0 - $0.00008

Verglichene Modelle

Z.ai: GLM 4.7 Flash vergleichen mit...

#22 · MoonshotAI

MoonshotAI: Kimi K2.5

Ohne Schlussfolgern

Score: 3.42

Konsistenz: 9.28

Erfolgsquote pro Versuch: 30.6%

Instabile Tests: 1

Kosten pro Ergebnis: 0.2049

Korrekte Tests: 3/12

Gesamtkosten: $0.00615

Vergleichen

#24 · X Ai

xAI: Grok 4.1 Fast

Ohne Schlussfolgern

Score: 3.25

Konsistenz: 9.17

Erfolgsquote pro Versuch: 30.6%

Instabile Tests: 1

Kosten pro Ergebnis: 0.1074

Korrekte Tests: 3/12

Gesamtkosten: $0.00323

Vergleichen

#21 · Xiaomi

Xiaomi: MiMo-V2-Flash

Schlussfolgern (medium)

Score: 3.92

Konsistenz: 7.89

Erfolgsquote pro Versuch: 44.4%

Instabile Tests: 3

Kosten pro Ergebnis: 0.4829

Korrekte Tests: 4/12

Gesamtkosten: $0.01932

Vergleichen

Schnellvergleich

Z.ai: GLM 4.7 Flash vergleichen mit...