#117

Claude Sonnet 5

Anthropic Rilis: 2026-06-30 Diuji pada: 2026-06-30 21:33 anthropic/claude-sonnet-5::none

(medium) (none)

Ringkasan

Claude Sonnet 5 mendapat skor 5.7 di AI BENCHY dan berada di peringkat #117. Model ini memiliki reliabilitas 10.0, tingkat keberhasilan 42.9%, total biaya $0.287, dan waktu respons rata-rata 4.74s.

Skor

5.7

Konsistensi

8.6

Keandalan

10.0

Total biaya (harga saat ini)

$0.287

Total token output

13,325

Total token input

76,797

Harga input

$2.000 / 1M

Harga output

$10.000 / 1M

Tes benar

Tes Salah: 14

Tingkat lulus per percobaan: 42.9%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

4.74s

Waktu respons (maks): 29.46s

Waktu respons (total): 99.46s

Jawaban salah: 7 Format tambahan: 4 Tidak ada jawaban: 2 Tidak mengikuti instruksi: 1

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Claude Sonnet 5

none

Biaya: $0.061
Waktu: 53.7s
Token: 6,172 tok

Riwayat harga

Data harga historis untuk model ini dari OpenRouter.

Tanggal	Harga input	Harga output
2026-06-30 21:35	$2.000 / 1M	$10.000 / 1M

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Claude Sonnet 5nonevsQwen3.5-Flashnone Claude Sonnet 5nonevsGemini 3.1 Flash Liteminimal Claude Sonnet 5nonevsGemma 4 31BnoneTersedia gratis Claude Sonnet 5nonevsGemini 2.5 Flashnone Claude Sonnet 5nonevsNemotron 3 Ultra 550b A55bnoneTersedia gratis Claude Sonnet 5nonevsGemini 3.5 Flashhigh Claude Sonnet 5nonevsGemini 3 Flash Previewmedium Claude Sonnet 5nonevsNemotron 3 Ultra 550b A55bmediumTersedia gratis Claude Sonnet 5nonevsGPT-5.5low

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	5.3	10.0
Pemrograman	4.6	7.9
Gabungan	3.0	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	5.3	7.2
Kecerdasan umum	4.7	3.1
Kepatuhan instruksi	6.4	10.0
Pemecahan teka-teki	6.0	7.4
Pemanggilan alat	10.0	10.0
Pengetahuan umum	3.0	10.0

Claude Sonnet 5

Hamster playing table tennis

#117 Claude Sonnet 5

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan