#51

Kimi K2.5

Moonshot AI Rilis: 2026-01-27 Diuji pada: 2026-04-20 17:48 moonshotai/kimi-k2.5::medium

(medium) (none)

Ringkasan

Kimi K2.5 mendapat skor 7.0 di AI BENCHY dan berada di peringkat #51. Model ini memiliki reliabilitas T/A, tingkat keberhasilan 72.2%, total biaya $0.220, dan waktu respons rata-rata 72.43s.

Yang membuat Kimi K2.5 unik: Model ini paling menonjol di Kecerdasan umum, dengan peringkat #4, sementara Pemrograman adalah area terlemahnya di #15.

Skor

7.0

Konsistensi

6.8

Keandalan

T/A

Total biaya (harga saat ini)

$0.220

Total token output

127,046

Total token input

Harga input

$0.440 / 1M

Harga output

$2.000 / 1M

Tes benar

Tes Salah: 9

Tingkat lulus per percobaan: 72.2%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

72.43s

Waktu respons (maks): 150.77s

Waktu respons (total): 796.70s

Jawaban salah: 4 Tidak mengikuti instruksi: 2 Kedaluwarsa: 2 Tidak ada jawaban: 1

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#51 MoonshotAI: Kimi K2.5

medium

Biaya: $0.030
Waktu: 58.6s
Token: 8,683 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-06-04 13:43 Tes baru ditambahkan	6.8	10.0	$0.328 ↓	Bandingkan
2026-05-22 00:12 Suite berubah	6.7	10.0	$0.314	Bandingkan
2026-04-20 17:48 Run pertama yang tercatat	7.0	T/A	$0.220	Run saat ini

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Kimi K2.5mediumvsDeepSeek V4 Prohigh Kimi K2.5mediumvsMiniMax M3medium Kimi K2.5mediumvsMercury 2medium Kimi K2.5mediumvsStep 3.7 Flashlow Kimi K2.5mediumvsGPT-5.3 Chatnone Kimi K2.5mediumvsGemini 3.5 Flashhigh Kimi K2.5mediumvsGemini 3 Flash Previewmedium Kimi K2.5mediumvsNemotron 3 Ultra 550b A55bmediumTersedia gratis Kimi K2.5mediumvsGPT-5.5low

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	7.3	5.8
Pemrograman	4.7	1.6
Gabungan	10.0	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	3.5	4.4
Kecerdasan umum	6.5	3.4
Kepatuhan instruksi	10.0	10.0
Pemecahan teka-teki	5.3	7.3
Pemanggilan alat	10.0	10.0

Kimi K2.5

Hamster playing table tennis

#51 MoonshotAI: Kimi K2.5

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan