#54
Moonshot AI
Rilis: 2026-04-20
Diuji pada: 2026-05-22 00:14
moonshotai/kimi-k2.6::medium
(medium)
(none)
7.4
Konsistensi
8.3
8.3
$0.916
Total token output
331,877
Total token input
0
Harga input
$0.730 / 1M
Harga output
$3.490 / 1M
Tes tidak stabil
4
Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).
Riwayat run
| Diuji pada | Skor | Keandalan | Tes benar | Total Biaya | Bandingkan |
|---|---|---|---|---|---|
| 2026-06-04 13:59 Tes baru ditambahkan | 7.2 | 7.8 | $0.891 ↓ | Bandingkan | |
| 2026-05-22 00:14 Suite berubah | 7.4 | 8.3 | $0.916 | Run saat ini | |
| 2026-04-23 10:54 Run pertama yang tercatat | 7.7 | T/A | $0.722 | Bandingkan |
Run ini menggunakan suite benchmark yang berbeda. Perhatikan perubahan suite saat membaca pergerakan historis.
Grafik
Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.
Skor vs Total Biaya
Waktu respons (rata-rata)
Skor vs Waktu respons (rata-rata)
Total token output
Skor vs Total token output
Perbandingan Cepat
Kimi K2.6mediumvsGPT-5 MinimediumKimi K2.6mediumvsMiMo-V2.5mediumKimi K2.6mediumvsStep 3.7 FlashlowKimi K2.6mediumvsClaude Sonnet 4.6mediumKimi K2.6mediumvsGemini 3.1 Flash Lite PreviewnoneKimi K2.6mediumvsGemini 3 Flash PreviewmediumKimi K2.6mediumvsGemini 3.5 FlashhighKimi K2.6mediumvsNemotron 3 Ultra 550b A55bmediumTersedia gratisKimi K2.6mediumvsGemini 3.5 Flashlow
Rincian Kategori
| Kategori | Skor | Konsistensi | Tes benar |
|---|---|---|---|
| Trik anti-AI | 7.0 | 8.0 | |
| Pemrograman | 6.5 | 5.3 | |
| Gabungan | 10.0 | 10.0 | |
| Parsing dan ekstraksi data | 10.0 | 10.0 | |
| Spesifik domain | 5.3 | 7.2 | |
| Kecerdasan umum | 10.0 | 10.0 | |
| Kepatuhan instruksi | 10.0 | 10.0 | |
| Pemecahan teka-teki | 6.0 | 7.4 | |
| Pemanggilan alat | 10.0 | 10.0 | |
| Pengetahuan umum | 3.0 | 10.0 |