Navigasi
AI BENCHY
Your ad here

AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs Xiaomi: MiMo-V2.5

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-04-22

Metrik Kimi K2.6 Kimi K2.6 medium Rilis: 2026-04-20 MiMo-V2.5 MiMo-V2.5 medium Rilis: 2026-04-22
Skor 7.7 7.8
Peringkat #36 #35
Konsistensi 8.3 8.6
Tes benar
Tingkat lulus per percobaan 74.1% 74.1%
Tes tidak stabil 4 3
Total Run 54 54
Biaya per hasil 6.563 2.102
Total Biaya $0.722 $0.253
Harga input $0.550 / 1M $0.400 / 1M
Harga output $2.500 / 1M $2.000 / 1M
Token output 80,759 2,840
Token penalaran 179,814 116,242
Waktu respons (rata-rata) 45.20s 13.71s
Waktu respons (maks) 215.85s 86.93s
Waktu respons (total) 768.37s 246.73s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Kimi K2.6 7.0 8.0 66.7% 1 11.59s 7,115 8,934
MiMo-V2.5 10.0 10.0 100.0% 0 1.98s 303 2,022
Pemrograman Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Kimi K2.6 10.0 10.0 100.0% 0 106.96s 3,236 18,817
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813
Gabungan Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Kimi K2.6 10.0 10.0 100.0% 0 40.96s 711 13,876
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
Parsing dan ekstraksi data Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Kimi K2.6 10.0 10.0 100.0% 0 20.38s 316 11,305
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
Spesifik domain Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Kimi K2.6 5.3 7.2 44.4% 1 202.38s 47,035 98,262
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
Kecerdasan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Kimi K2.6 10.0 10.0 100.0% 0 17.83s 3,981 4,472
MiMo-V2.5 3.8 2.5 33.3% 1 1.55s 118 170
Kepatuhan instruksi Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Kimi K2.6 10.0 10.0 100.0% 0 12.53s 3,977 5,269
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
Pemecahan teka-teki Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Kimi K2.6 5.0 5.2 44.5% 2 25.59s 14,140 17,868
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
Pemanggilan alat Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Kimi K2.6 10.0 10.0 100.0% 0 8.92s 248 1,011
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424

Perbandingan Cepat

Ganti Pasangan Perbandingan