AI BENCHY
Bandingkan
❤️ Made by XCS

Nama Model

OpenAI: GPT-4o-mini

Benchmark dihasilkan dari suite pengujian Aibenchy pada : 19 Feb 2026

Metrik OpenAI: GPT-4o-mini
Peringkat#19
PerusahaanOpenAI
Score 4.00
Konsistensi 9.98
Biaya per hasil 0.0576
Total Biaya $0.00173
Tes benar 3/12
Tingkat lulus per percobaan 25.0%
Tes tidak stabil 0
Token output 570
Token penalaran 0

Rincian Kategori

Kategori Tes lulus penuh Score Konsistensi Tingkat lulus per percobaan Tes tidak stabil Skor penalaran Biaya
Anti-AI Tricks 0/2 1.00 10.00 0.0% 0 - $0.00005
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 - $0.00115
Domain specific 0/3 1.00 10.00 0.0% 0 - $0.00012
Instructions following 1/2 5.50 10.00 50.0% 0 - $0.00015
Puzzle Solving 0/3 4.00 9.92 0.0% 0 - $0.00028

Model yang Dibandingkan

Bandingkan OpenAI: GPT-4o-mini dengan...

#18 · Stepfun

StepFun: Step 3.5 Flash

Penalaran (medium)

Score: 4.92

Konsistensi: 7.34

Tingkat lulus per percobaan: 58.3%

Tes tidak stabil: 4

Biaya per hasil: 0.0000

Tes benar: 5/12

Total Biaya: $0.00000

Bandingkan

#20 · Z.ai

Z.ai: GLM 4.7 Flash

Penalaran (medium)

Score: 3.92

Konsistensi: 6.51

Tingkat lulus per percobaan: 50.0%

Tes tidak stabil: 5

Biaya per hasil: 0.2253

Tes benar: 4/12

Total Biaya: $0.00902

Bandingkan

#17 · MiniMax

MiniMax: MiniMax M2.5

Penalaran (medium)

Score: 5.08

Konsistensi: 6.00

Tingkat lulus per percobaan: 61.1%

Tes tidak stabil: 6

Biaya per hasil: 4.0276

Tes benar: 5/12

Total Biaya: $0.20138

Bandingkan

Perbandingan Cepat

Bandingkan OpenAI: GPT-4o-mini dengan...