AI BENCHY
Vergleichen
❤️ Made by XCS

Modellname

OpenAI: GPT-4o-mini

Benchmarks aus Aibenchy-Test-Suites generiert am : 19.02.2026

Metrik OpenAI: GPT-4o-mini
Rang#19
UnternehmenOpenAI
Score 4.00
Konsistenz 9.98
Kosten pro Ergebnis 0.0576
Gesamtkosten $0.00173
Korrekte Tests 3/12
Erfolgsquote pro Versuch 25.0%
Instabile Tests 0
Ausgabe-Token 570
Denk-Token 0

Kategorieaufschlüsselung

Kategorie Vollständig bestandene Tests Score Konsistenz Erfolgsquote pro Versuch Instabile Tests Begründungswert Kosten
Anti-AI Tricks 0/2 1.00 10.00 0.0% 0 - $0.00005
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 - $0.00115
Domain specific 0/3 1.00 10.00 0.0% 0 - $0.00012
Instructions following 1/2 5.50 10.00 50.0% 0 - $0.00015
Puzzle Solving 0/3 4.00 9.92 0.0% 0 - $0.00028

Verglichene Modelle

OpenAI: GPT-4o-mini vergleichen mit...

#18 · Stepfun

StepFun: Step 3.5 Flash

Schlussfolgern (medium)

Score: 4.92

Konsistenz: 7.34

Erfolgsquote pro Versuch: 58.3%

Instabile Tests: 4

Kosten pro Ergebnis: 0.0000

Korrekte Tests: 5/12

Gesamtkosten: $0.00000

Vergleichen

#20 · Z.ai

Z.ai: GLM 4.7 Flash

Schlussfolgern (medium)

Score: 3.92

Konsistenz: 6.51

Erfolgsquote pro Versuch: 50.0%

Instabile Tests: 5

Kosten pro Ergebnis: 0.2253

Korrekte Tests: 4/12

Gesamtkosten: $0.00902

Vergleichen

#17 · MiniMax

MiniMax: MiniMax M2.5

Schlussfolgern (medium)

Score: 5.08

Konsistenz: 6.00

Erfolgsquote pro Versuch: 61.1%

Instabile Tests: 6

Kosten pro Ergebnis: 4.0276

Korrekte Tests: 5/12

Gesamtkosten: $0.20138

Vergleichen

Schnellvergleich

OpenAI: GPT-4o-mini vergleichen mit...