Navigasi
AI BENCHY
Your ad here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Xiaomi: MiMo-V2.5

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-04-25

Metrik DeepSeek V4 Pro DeepSeek V4 Pro high Rilis: 2026-04-24 MiMo-V2.5 MiMo-V2.5 medium Rilis: 2026-04-22
Skor 7.4 7.8
Peringkat #49 #40
Keandalan 3.9 T/A
Konsistensi 9.2 8.6
Tes benar
Tingkat lulus per percobaan 77.8% 74.1%
Tes tidak stabil 2 3
Total Run 54 54
Biaya per hasil 2.524 2.102
Total Biaya $0.329 $0.253
Harga input $1.740 / 1M $0.400 / 1M
Harga output $3.480 / 1M $2.000 / 1M
Token output 1,937 2,840
Token penalaran 82,625 116,242
Waktu respons (rata-rata) 72.92s 13.71s
Waktu respons (maks) 414.38s 86.93s
Waktu respons (total) 1312.59s 246.73s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Pro 7.4 10.0 75.0% 0 29.33s 83 3,829
MiMo-V2.5 10.0 10.0 100.0% 0 1.98s 303 2,022
Pemrograman Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Pro 10.0 10.0 100.0% 0 81.96s 339 6,962
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813
Gabungan Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Pro 6.6 10.0 100.0% 0 71.08s 134 2,163
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
Parsing dan ekstraksi data Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Pro 8.8 10.0 100.0% 0 88.40s 795 6,370
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
Spesifik domain Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Pro 4.5 10.0 33.3% 0 202.43s 22 53,478
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
Kecerdasan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Pro 6.1 3.1 66.7% 1 23.11s 106 1,248
MiMo-V2.5 3.8 2.5 33.3% 1 1.55s 118 170
Kepatuhan instruksi Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Pro 10.0 10.0 100.0% 0 20.97s 66 2,590
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
Pemecahan teka-teki Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Pro 7.6 7.4 77.8% 1 51.47s 223 5,645
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
Pemanggilan alat Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Pro 7.6 10.0 100.0% 0 38.69s 169 340
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424

Perbandingan Cepat

Ganti Pasangan Perbandingan