AI BENCHY
Vergleichen
❤️ Made by XCS

Modellname

xAI: Grok 4.1 Fast

Benchmarks aus Aibenchy-Test-Suites generiert am : 19.02.2026

Metrik xAI: Grok 4.1 Fast
Rang#8
UnternehmenX Ai
Score 6.42
Konsistenz 8.60
Kosten pro Ergebnis 0.4800
Gesamtkosten $0.03360
Korrekte Tests 7/12
Erfolgsquote pro Versuch 66.7%
Instabile Tests 2
Ausgabe-Token 437
Denk-Token 61,090

Kategorieaufschlüsselung

Kategorie Vollständig bestandene Tests Score Konsistenz Erfolgsquote pro Versuch Instabile Tests Begründungswert Kosten
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 4.00 $0.00151
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.00 $0.00438
Domain specific 1/3 4.00 7.21 55.6% 1 5.00 $0.02064
Instructions following 1/2 5.50 10.00 50.0% 0 3.25 $0.00191
Puzzle Solving 1/3 4.67 7.20 44.4% 1 8.50 $0.00518

Verglichene Modelle

xAI: Grok 4.1 Fast vergleichen mit...

#7 · Z.ai

Z.ai: GLM 5

Schlussfolgern (medium)

Score: 6.83

Konsistenz: 7.86

Erfolgsquote pro Versuch: 80.6%

Instabile Tests: 3

Kosten pro Ergebnis: 1.3424

Korrekte Tests: 8/12

Gesamtkosten: $0.10740

Vergleichen

#9 · MoonshotAI

MoonshotAI: Kimi K2.5

Schlussfolgern (medium)

Score: 6.42

Konsistenz: 8.00

Erfolgsquote pro Versuch: 72.2%

Instabile Tests: 3

Kosten pro Ergebnis: 2.4097

Korrekte Tests: 7/12

Gesamtkosten: $0.16868

Vergleichen

#6 · Anthropic

Anthropic: Claude Sonnet 4.6

Schlussfolgern (medium)

Score: 7.00

Konsistenz: 9.30

Erfolgsquote pro Versuch: 69.4%

Instabile Tests: 1

Kosten pro Ergebnis: 9.3797

Korrekte Tests: 8/12

Gesamtkosten: $0.75038

Vergleichen

Schnellvergleich

xAI: Grok 4.1 Fast vergleichen mit...