#95

MiMo-V2.5

Xiaomi Rilis: 2026-04-22 Diuji pada: 2026-04-22 21:39 xiaomi/mimo-v2.5::none

(medium) (none)

Ringkasan

MiMo-V2.5 mendapat skor 5.1 di AI BENCHY dan berada di peringkat #95. Model ini memiliki reliabilitas T/A, tingkat keberhasilan 27.8%, total biaya $0.019, dan waktu respons rata-rata 1.05s.

Yang membuat MiMo-V2.5 unik: Model ini paling menonjol di Pemrograman, dengan peringkat #1, sementara Trik anti-AI adalah area terlemahnya di #16. Total biaya benchmark-nya sangat rendah untuk kisaran skornya. Model ini terasa cepat dibandingkan model serupa.

Skor

5.1

Konsistensi

10.0

Keandalan

T/A

Total biaya (harga saat ini)

$0.019

Total token output

2,177

Total token input

Harga input

$0.400 / 1M

Harga output

$2.000 / 1M

Tes benar

Tes Salah: 13

Tingkat lulus per percobaan: 27.8%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

1.05s

Waktu respons (maks): 2.43s

Waktu respons (total): 18.94s

Jawaban salah: 10 Tidak mengikuti instruksi: 2 Format tambahan: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#95 MiMo-V2.5

none

Biaya: $0.007
Waktu: 267.4s
Token: 25,283 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-07-16 22:42 Tes baru ditambahkan	5.1	10.0	$0.025 ↓	Bandingkan
2026-06-04 13:48 Tes baru ditambahkan	4.9	10.0	$0.007 ↓	Bandingkan
2026-05-22 12:51 Tes baru ditambahkan	4.8	10.0	$0.021	Bandingkan
2026-05-08 15:33 Suite berubah	4.9	10.0	$0.019	Bandingkan
2026-04-22 21:39 Run pertama yang tercatat	5.1	T/A	$0.019	Run saat ini

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

MiMo-V2.5nonevsKAT-Coder-Air V2.5medium MiMo-V2.5nonevsGLM 5.1none MiMo-V2.5nonevsQwen3.6 27Bnone MiMo-V2.5nonevsGemini 3.6 Flashmedium MiMo-V2.5nonevsGemini 3.6 Flashhigh MiMo-V2.5nonevsNemotron 3 UltramediumTersedia gratis MiMo-V2.5nonevsGPT-5.5low

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	4.8	10.0
Pemrograman	10.0	10.0
Gabungan	3.0	10.0
Parsing dan ekstraksi data	6.5	10.0
Spesifik domain	3.0	10.0
Kecerdasan umum	4.6	10.0
Kepatuhan instruksi	6.5	10.0
Pemecahan teka-teki	3.4	10.0
Pemanggilan alat	10.0	10.0

MiMo-V2.5

Hamster playing table tennis

#95 MiMo-V2.5

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan