AI BENCHY
Vergleichen
❤️ Made by XCS

Modellname

Z.ai: GLM 4.7 Flash

Benchmarks aus Aibenchy-Test-Suites generiert am : 19.02.2026

Metrik Z.ai: GLM 4.7 Flash
Rang#20
UnternehmenZ.ai
Score 3.92
Konsistenz 6.51
Kosten pro Ergebnis 0.2253
Gesamtkosten $0.00902
Korrekte Tests 4/12
Erfolgsquote pro Versuch 50.0%
Instabile Tests 5
Ausgabe-Token 7,601
Denk-Token 18,390

Kategorieaufschlüsselung

Kategorie Vollständig bestandene Tests Score Konsistenz Erfolgsquote pro Versuch Instabile Tests Begründungswert Kosten
Anti-AI Tricks 1/2 5.50 5.81 66.7% 1 9.08 $0.00131
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.87 $0.00281
Domain specific 0/3 1.00 4.41 33.3% 2 8.21 $0.00183
Instructions following 1/2 5.00 5.81 66.7% 1 9.50 $0.00105
Puzzle Solving 0/3 1.00 7.20 11.1% 1 7.33 $0.00203

Verglichene Modelle

Z.ai: GLM 4.7 Flash vergleichen mit...

#19 · OpenAI

OpenAI: GPT-4o-mini

Ohne Schlussfolgern

Score: 4.00

Konsistenz: 9.98

Erfolgsquote pro Versuch: 25.0%

Instabile Tests: 0

Kosten pro Ergebnis: 0.0576

Korrekte Tests: 3/12

Gesamtkosten: $0.00173

Vergleichen

#21 · Xiaomi

Xiaomi: MiMo-V2-Flash

Schlussfolgern (medium)

Score: 3.92

Konsistenz: 7.89

Erfolgsquote pro Versuch: 44.4%

Instabile Tests: 3

Kosten pro Ergebnis: 0.4829

Korrekte Tests: 4/12

Gesamtkosten: $0.01932

Vergleichen

#18 · Stepfun

StepFun: Step 3.5 Flash

Schlussfolgern (medium)

Score: 4.92

Konsistenz: 7.34

Erfolgsquote pro Versuch: 58.3%

Instabile Tests: 4

Kosten pro Ergebnis: 0.0000

Korrekte Tests: 5/12

Gesamtkosten: $0.00000

Vergleichen

Schnellvergleich

Z.ai: GLM 4.7 Flash vergleichen mit...