#20
DeepSeek
Rilis: 2026-04-24
Diuji pada: 2026-04-25 21:53
deepseek/deepseek-v4-pro::high
(high)
(none)
Harga input
$1.740 / 1M
Harga output
$3.480 / 1M
Tes tidak stabil
2
Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).
Riwayat run
| Diuji pada | Skor | Keandalan | Tes benar | Total Biaya | Bandingkan |
|---|---|---|---|---|---|
| 2026-05-22 00:54 Suite berubah | 6.6 | 9.0 | $0.212 | Bandingkan | |
| 2026-04-29 14:47 Uji ulang | 7.5 | 9.3 | $0.209 | Bandingkan | |
| 2026-04-26 10:50 Uji ulang | 7.5 | 8.4 | $0.201 | Bandingkan | |
| 2026-04-25 21:53 Run awal | 8.2 | T/A | $0.329 | Run saat ini |
Perbandingan run
| Run | Skor | Konsistensi | Keandalan | Tes benar | Tes tidak stabil | Total token output | Total Biaya | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-25 21:53 · Run awal | 8.2 | 9.2 | T/A | 13/18 | 2 | 84,562 | $0.329 | 72.92s |
| 2026-05-22 00:54 · Suite berubah | 6.6 | 8.3 | 9.0 | 11/20 | 4 | 65,985 | $0.212 | 58.93s |
| Selisih | +1.6 | +0.9 | +2 | -2 | +18577 | +$0.117 | +13988ms |
Kedua run ini menggunakan suite benchmark yang berbeda, jadi selisihnya mencerminkan perubahan model sekaligus perubahan suite.
Grafik
Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.
Skor vs Total Biaya
Waktu respons (rata-rata)
Skor vs Waktu respons (rata-rata)
Total token output
Skor vs Total token output
Perbandingan Cepat
DeepSeek V4 ProhighvsQwen3.5-35B-A3BmediumDeepSeek V4 ProhighvsRing-2.6-1TnoneDeepSeek V4 ProhighvsDeepSeek V3.2mediumDeepSeek V4 ProhighvsClaude Opus 4.6mediumDeepSeek V4 ProhighvsGPT-5.4 NanomediumDeepSeek V4 ProhighvsGemini 3 Flash PreviewmediumDeepSeek V4 ProhighvsGemini 3.5 FlashhighDeepSeek V4 ProhighvsRing-2.6-1TmediumDeepSeek V4 ProhighvsGemini 3.5 Flashlow
Rincian Kategori
| Kategori | Skor | Konsistensi | Tes benar |
|---|---|---|---|
| Trik anti-AI | 8.3 | 10.0 | |
| Pemrograman | 10.0 | 10.0 | |
| Gabungan | 10.0 | 10.0 | |
| Parsing dan ekstraksi data | 10.0 | 10.0 | |
| Spesifik domain | 5.3 | 10.0 | |
| Kecerdasan umum | 6.1 | 3.1 | |
| Kepatuhan instruksi | 10.0 | 10.0 | |
| Pemecahan teka-teki | 7.6 | 7.4 | |
| Pemanggilan alat | 10.0 | 10.0 |