AI BENCHY
Bandingkan
❤️ Made by XCS

Nama Model

MiniMax: MiniMax M2.5

Benchmark dihasilkan dari suite pengujian Aibenchy pada : 19 Feb 2026

Metrik MiniMax: MiniMax M2.5
Peringkat#17
PerusahaanMiniMax
Score 5.08
Konsistensi 6.00
Biaya per hasil 4.0276
Total Biaya $0.20138
Tes benar 5/12
Tingkat lulus per percobaan 61.1%
Tes tidak stabil 6
Token output 121,028
Token penalaran 165,110

Rincian Kategori

Kategori Tes lulus penuh Score Konsistensi Tingkat lulus per percobaan Tes tidak stabil Skor penalaran Biaya
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 7.58 $0.00902
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 9.45 $0.00774
Domain specific 0/3 1.00 4.41 22.2% 2 6.06 $0.16952
Instructions following 1/2 7.00 6.41 66.7% 1 8.33 $0.00307
Puzzle Solving 1/3 4.33 4.79 55.5% 2 8.28 $0.01205

Model yang Dibandingkan

Bandingkan MiniMax: MiniMax M2.5 dengan...

#16 · Anthropic

Anthropic: Claude Opus 4.6

Penalaran (medium)

Score: 5.42

Konsistensi: 8.60

Tingkat lulus per percobaan: 55.5%

Tes tidak stabil: 2

Biaya per hasil: 12.8695

Tes benar: 6/12

Total Biaya: $0.77217

Bandingkan

#18 · Stepfun

StepFun: Step 3.5 Flash

Penalaran (medium)

Score: 4.92

Konsistensi: 7.34

Tingkat lulus per percobaan: 58.3%

Tes tidak stabil: 4

Biaya per hasil: 0.0000

Tes benar: 5/12

Total Biaya: $0.00000

Bandingkan

#15 · Z.ai

Z.ai: GLM 5

Tanpa penalaran

Score: 5.42

Konsistensi: 10.00

Tingkat lulus per percobaan: 50.0%

Tes tidak stabil: 0

Biaya per hasil: 0.0704

Tes benar: 6/12

Total Biaya: $0.00423

Bandingkan

Perbandingan Cepat

Bandingkan MiniMax: MiniMax M2.5 dengan...