AI BENCHY
Vergelijken
❤️ Made by XCS

Modelnaam

OpenAI: GPT-4o-mini

Benchmarks gegenereerd uit Aibenchy-testsuites op : 19 feb 2026

Metriek OpenAI: GPT-4o-mini
Rang#19
BedrijfOpenAI
Score 4.00
Consistentie 9.98
Kosten per resultaat 0.0576
Totale kosten $0.00173
Correcte tests 3/12
Slaagpercentage per poging 25.0%
Instabiele tests 0
Uitvoer-tokens 570
Redeneer-tokens 0

Categorie-uitsplitsing

Categorie Volledig geslaagde tests Score Consistentie Slaagpercentage per poging Instabiele tests Redeneerscore Kosten
Anti-AI Tricks 0/2 1.00 10.00 0.0% 0 - $0.00005
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 - $0.00115
Domain specific 0/3 1.00 10.00 0.0% 0 - $0.00012
Instructions following 1/2 5.50 10.00 50.0% 0 - $0.00015
Puzzle Solving 0/3 4.00 9.92 0.0% 0 - $0.00028

Vergeleken modellen

Vergelijk OpenAI: GPT-4o-mini met...

#18 · Stepfun

StepFun: Step 3.5 Flash

Redenering (medium)

Score: 4.92

Consistentie: 7.34

Slaagpercentage per poging: 58.3%

Instabiele tests: 4

Kosten per resultaat: 0.0000

Correcte tests: 5/12

Totale kosten: $0.00000

Vergelijken

#20 · Z.ai

Z.ai: GLM 4.7 Flash

Redenering (medium)

Score: 3.92

Consistentie: 6.51

Slaagpercentage per poging: 50.0%

Instabiele tests: 5

Kosten per resultaat: 0.2253

Correcte tests: 4/12

Totale kosten: $0.00902

Vergelijken

#17 · MiniMax

MiniMax: MiniMax M2.5

Redenering (medium)

Score: 5.08

Consistentie: 6.00

Slaagpercentage per poging: 61.1%

Instabiele tests: 6

Kosten per resultaat: 4.0276

Correcte tests: 5/12

Totale kosten: $0.20138

Vergelijken

Snelle vergelijking

Vergelijk OpenAI: GPT-4o-mini met...