#103

MiMo-V2-Flash

Xiaomi Rilis: 2025-12-16 Diuji pada: 2026-04-11 01:44 xiaomi/mimo-v2-flash::none

(medium) (none)

Ringkasan

MiMo-V2-Flash mendapat skor 4.5 di AI BENCHY dan berada di peringkat #103. Model ini memiliki reliabilitas T/A, tingkat keberhasilan 27.8%, total biaya $0.023, dan waktu respons rata-rata 2.79s.

Yang membuat MiMo-V2-Flash unik: Model ini paling menonjol di Pemrograman, dengan peringkat #1, sementara Parsing dan ekstraksi data adalah area terlemahnya di #15.

Model diarsipkan: model ini tidak lagi diperbarui atau diuji pada pengujian baru.

Skor

4.5

Konsistensi

7.8

Keandalan

T/A

Total biaya (harga saat ini)

$0.023

Total token output

68,522

Total token input

Harga input

$0.090 / 1M

Harga output

$0.290 / 1M

Tes benar

Tes Salah: 15

Tingkat lulus per percobaan: 27.8%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

2.79s

Waktu respons (maks): 19.68s

Waktu respons (total): 39.08s

Jawaban salah: 12 Kesalahan API: 1 Format tambahan: 1 Tidak mengikuti instruksi: 1

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#103 MiMo-V2-Flash

none

Biaya: $0.001
Waktu: 7.7s
Token: 1,481 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-06-04 13:47 Tes baru ditambahkan	4.6	6.7	$0.025 ↑	Bandingkan
2026-05-22 00:20 Suite berubah	4.4	10.0	$0.024	Bandingkan
2026-04-11 01:44 Run pertama yang tercatat	4.5	T/A	$0.023	Run saat ini

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

MiMo-V2-FlashnonevsGemini 3.5 Flashhigh MiMo-V2-FlashnonevsGemini 3 Flash Previewmedium MiMo-V2-FlashnonevsNemotron 3 Ultra 550b A55bmediumTersedia gratis MiMo-V2-FlashnonevsGPT-5.5low

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	3.2	8.0
Pemrograman	6.3	3.7
Gabungan	3.0	10.0
Parsing dan ekstraksi data	2.9	5.8
Spesifik domain	5.3	7.2
Kecerdasan umum	4.6	10.0
Kepatuhan instruksi	6.5	10.0
Pemecahan teka-teki	3.6	7.2
Pemanggilan alat	10.0	10.0

MiMo-V2-Flash

Hamster playing table tennis

#103 MiMo-V2-Flash

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan