AI BENCHY
Compară
❤️ Made by XCS

Nume model

OpenAI: GPT-4o-mini

Benchmark-urile au fost generate din suitele de teste Aibenchy la : 19 feb. 2026

Metrică OpenAI: GPT-4o-mini
Rang#19
CompanieOpenAI
Score 4.00
Consistență 9.98
Cost per rezultat 0.0576
Cost total $0.00173
Teste corecte 3/12
Rată de trecere pe încercare 25.0%
Teste instabile 0
Tokenuri de ieșire 570
Tokenuri de raționament 0

Defalcare pe categorii

Categorie Teste trecute complet Score Consistență Rată de trecere pe încercare Teste instabile Scor de raționament Cost
Anti-AI Tricks 0/2 1.00 10.00 0.0% 0 - $0.00005
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 - $0.00115
Domain specific 0/3 1.00 10.00 0.0% 0 - $0.00012
Instructions following 1/2 5.50 10.00 50.0% 0 - $0.00015
Puzzle Solving 0/3 4.00 9.92 0.0% 0 - $0.00028

Modele comparate

Compară OpenAI: GPT-4o-mini cu...

#18 · Stepfun

StepFun: Step 3.5 Flash

Raționament (medium)

Score: 4.92

Consistență: 7.34

Rată de trecere pe încercare: 58.3%

Teste instabile: 4

Cost per rezultat: 0.0000

Teste corecte: 5/12

Cost total: $0.00000

Compară

#20 · Z.ai

Z.ai: GLM 4.7 Flash

Raționament (medium)

Score: 3.92

Consistență: 6.51

Rată de trecere pe încercare: 50.0%

Teste instabile: 5

Cost per rezultat: 0.2253

Teste corecte: 4/12

Cost total: $0.00902

Compară

#17 · MiniMax

MiniMax: MiniMax M2.5

Raționament (medium)

Score: 5.08

Consistență: 6.00

Rată de trecere pe încercare: 61.1%

Teste instabile: 6

Cost per rezultat: 4.0276

Teste corecte: 5/12

Cost total: $0.20138

Compară

Comparație rapidă

Compară OpenAI: GPT-4o-mini cu...