AI BENCHY
Bandingkan
❤️ Made by XCS
Your ad here

Nama Model

MoonshotAI: Kimi K2.5

Tanpa penalaran

Benchmark dihasilkan dari suite pengujian AI BENCHY pada : 24 Feb 2026

Metrik MoonshotAI: Kimi K2.5
Peringkat#24
PerusahaanMoonshotAI
Score 3.62
Konsistensi 8.84
Biaya per hasil 0.2413
Total Biaya $0.00725
Tes benar
Tingkat lulus per percobaan 30.8%
Tes tidak stabil 2
Token output 1,695
Token penalaran 0
Waktu respons (rata-rata)11378ms
Waktu respons (total)11378ms
Waktu respons (maks)11378ms

Rincian Kategori

Kategori Tes lulus penuh Score Konsistensi Tingkat lulus per percobaan Tes tidak stabil Skor penalaran Waktu respons (rata-rata) Biaya
Trik anti-AI 2.67 7.86 11.1% 1 - 11378ms $0.00121
Parsing dan ekstraksi data 5.50 5.81 83.3% 1 - 0ms $0.00455
Spesifik domain 4.00 10.00 33.3% 0 - 0ms $0.00027
Kepatuhan instruksi 5.00 9.99 50.0% 0 - 0ms $0.00035
Puzzle Solving 2.00 9.92 0.0% 0 - 0ms $0.00090

Model yang Dibandingkan

Bandingkan MoonshotAI: Kimi K2.5 dengan...

#23 · Z.ai

Z.ai: GLM 4.7 Flash

Penalaran (medium)

Score: 3.69

Konsistensi: 6.15

Tingkat lulus per percobaan: 48.7%

Tes tidak stabil: 6

Biaya per hasil: 0.2600

Tes benar:

Total Biaya: $0.01041

Bandingkan

#25 · X Ai

xAI: Grok 4.1 Fast

Tanpa penalaran

Score: 3.15

Konsistensi: 9.24

Tingkat lulus per percobaan: 28.2%

Tes tidak stabil: 1

Biaya per hasil: 0.1153

Tes benar:

Total Biaya: $0.00346

Bandingkan

#22 · Xiaomi

Xiaomi: MiMo-V2-Flash

Penalaran (medium)

Score: 3.77

Konsistensi: 7.46

Tingkat lulus per percobaan: 43.6%

Tes tidak stabil: 4

Biaya per hasil: 0.5072

Tes benar:

Total Biaya: $0.02029

Bandingkan

Perbandingan Cepat

Bandingkan MoonshotAI: Kimi K2.5 dengan...