Navigasi
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs Xiaomi: MiMo-V2-Omni

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-05-08

Metrik Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Rilis: 2026-05-08 MiMo-V2-Omni MiMo-V2-Omni medium Rilis: 2026-03-18
Skor 6.8 7.2
Peringkat #68 #62
Keandalan 10.0 10.0
Konsistensi 8.7 9.1
Tes benar
Tingkat lulus per percobaan 59.7% 59.7%
Tes tidak stabil 3 2
Total Run 57 49
Biaya per hasil 0.111 4.504
Total Biaya $0.012 $0.451
Harga input $0.250 / 1M $0.400 / 1M
Harga output $1.500 / 1M $2.000 / 1M
Token output 2,457 1,925
Token penalaran 0 216,652
Waktu respons (rata-rata) 1.41s 27.58s
Waktu respons (maks) 4.49s 234.19s
Waktu respons (total) 26.72s 524.03s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 8.3 10.0 75.0% 0 1.10s 639 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.75s 269 1,701
Pemrograman Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.31s 636 0
MiMo-V2-Omni 4.0 7.9 0.0% 0 68.55s 265 33,660
Gabungan Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.53s 357 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 25.87s 380 8,673
Parsing dan ekstraksi data Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.04s 279 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 3.04s 155 591
Spesifik domain Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 1.02s 15 0
MiMo-V2-Omni 3.0 10.0 0.0% 0 47.89s 155 68,398
Kecerdasan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 791ms 63 0
MiMo-V2-Omni 5.4 2.5 66.7% 1 3.61s 136 492
Kepatuhan instruksi Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 932ms 72 0
MiMo-V2-Omni 8.3 10.0 50.0% 0 4.99s 49 515
Pemecahan teka-teki Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 6.0 4.6 66.7% 2 2.15s 153 0
MiMo-V2-Omni 5.9 7.2 55.6% 1 2.38s 210 860
Pemanggilan alat Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 3.51s 234 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 13.98s 303 3,461
Pengetahuan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 724ms 9 0
MiMo-V2-Omni 3.0 10.0 0.0% 0 234.19s 3 98,301

Perbandingan Cepat

Ganti Pasangan Perbandingan