Total Tes: 4
Tes Salah: 0
Score: 10.00
Token output: 220
Token penalaran: 6,003
| Kategori | Tes | Salah | Score | Token output | Token penalaran |
|---|---|---|---|---|---|
| Anti-AI Tricks | 2 | 0 | 10.00 | 201 | 585 |
| Domain specific | 1 | 0 | 10.00 | 0 | 4,865 |
| Puzzle Solving | 1 | 0 | 10.00 | 19 | 553 |
Aibenchy
2026-02-16T02:24:03.805Z
| Peringkat | Nama Model | Perusahaan ⓘ | Score ⓘ | Biaya per hasil ⓘ | Tes benar ⓘ | ||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| #1 | Z.ai: GLM 5 Penalaran (medium) Rilis: Tanggal rilis tidak diketahui · Total Biaya: $0.0159816 | Z.ai | 10.00 | 0.3995 | 4/4 | ||||||||||||||||||||||||
| Total Tes: 4 Tes Salah: 0 Score: 10.00 Token output: 220 Token penalaran: 6,003
| |||||||||||||||||||||||||||||
| #2 | StepFun: Step 3.5 Flash Tanpa penalaran Tersedia gratis Rilis: Tanggal rilis tidak diketahui · Total Biaya: $0.0000 | StepFun | 8.00 | 0.0000 | 3/4 | ||||||||||||||||||||||||
| Total Tes: 4 Tes Salah: 1 Score: 8.00 Token output: 225 Token penalaran: 4,197
| |||||||||||||||||||||||||||||
| #3 | Z.ai: GLM 5 Tanpa penalaran Rilis: Tanggal rilis tidak diketahui · Total Biaya: $0.0123402 | Z.ai | 7.75 | 0.4113 | 3/4 | ||||||||||||||||||||||||
| Total Tes: 4 Tes Salah: 1 Score: 7.75 Token output: 282 Token penalaran: 4,697
| |||||||||||||||||||||||||||||
| #4 | MiniMax: MiniMax M2.5 Tanpa penalaran Rilis: Tanggal rilis tidak diketahui · Total Biaya: $0.0142142 | MiniMax | 7.75 | 0.4738 | 3/4 | ||||||||||||||||||||||||
| Total Tes: 4 Tes Salah: 1 Score: 7.75 Token output: 101 Token penalaran: 15,007
| |||||||||||||||||||||||||||||
| #5 | Z.ai: GLM 4.7 Flash Tanpa penalaran Rilis: Tanggal rilis tidak diketahui · Total Biaya: $0.00087212 | Z.ai | 5.50 | 0.0436 | 2/4 | ||||||||||||||||||||||||
| Total Tes: 4 Tes Salah: 2 Score: 5.50 Token output: 218 Token penalaran: 1,932
| |||||||||||||||||||||||||||||
| #6 | Qwen: Qwen3 Coder Next Penalaran (medium) Rilis: Tanggal rilis tidak diketahui · Total Biaya: $0.00003684 | Qwen | 3.25 | 0.0037 | 1/4 | ||||||||||||||||||||||||
| Total Tes: 4 Tes Salah: 3 Score: 3.25 Token output: 64 Token penalaran: 0
| |||||||||||||||||||||||||||||
| #7 | Qwen: Qwen3 Coder Next Tanpa penalaran Rilis: Tanggal rilis tidak diketahui · Total Biaya: $0.00003894 | Qwen | 3.25 | 0.0039 | 1/4 | ||||||||||||||||||||||||
| Total Tes: 4 Tes Salah: 3 Score: 3.25 Token output: 71 Token penalaran: 0
| |||||||||||||||||||||||||||||
| #8 | Z.ai: GLM 4.7 Flash Penalaran (medium) Rilis: Tanggal rilis tidak diketahui · Total Biaya: $0.00733692 | Z.ai | 3.25 | 0.7337 | 1/4 | ||||||||||||||||||||||||
| Total Tes: 4 Tes Salah: 3 Score: 3.25 Token output: 1,159 Token penalaran: 17,192
| |||||||||||||||||||||||||||||
| #9 | MiniMax: MiniMax M2.5 Penalaran (medium) Rilis: Tanggal rilis tidak diketahui · Total Biaya: $0.0225838 | MiniMax | 3.25 | 2.2584 | 1/4 | ||||||||||||||||||||||||
| Total Tes: 4 Tes Salah: 3 Score: 3.25 Token output: 46 Token penalaran: 22,487
| |||||||||||||||||||||||||||||
| #10 | OpenAI: GPT-4o-mini Tanpa penalaran Rilis: Tanggal rilis tidak diketahui · Total Biaya: $0.0000591 | OpenAI | 1.00 | - | 0/4 | ||||||||||||||||||||||||
| Total Tes: 4 Tes Salah: 4 Score: 1.00 Token output: 38 Token penalaran: 0
| |||||||||||||||||||||||||||||
Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.