#30

Claude Sonnet 5

Anthropic Rilis: 2026-06-30 Diuji pada: 2026-06-30 21:33 anthropic/claude-sonnet-5::medium

(medium) (none)

Ringkasan

Claude Sonnet 5 mendapat skor 7.9 di AI BENCHY dan berada di peringkat #30. Model ini memiliki reliabilitas 10.0, tingkat keberhasilan 79.4%, total biaya $0.550, dan waktu respons rata-rata 9.94s.

Yang membuat Claude Sonnet 5 unik: Model ini paling menonjol di Spesifik domain, dengan peringkat #1, sementara Gabungan adalah area terlemahnya di #17.

Skor

7.9

Konsistensi

9.0

Keandalan

10.0

Total biaya (harga saat ini)

$0.550

Total token output

41,685

Total token input

67,416

Harga input

$2.000 / 1M

Harga output

$10.000 / 1M

Tes benar

Tes Salah: 6

Tingkat lulus per percobaan: 79.4%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

9.94s

Waktu respons (maks): 56.94s

Waktu respons (total): 208.71s

Jawaban salah: 4 Tidak mengikuti instruksi: 1 Pemanggilan alat tidak valid: 1

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#30 Claude Sonnet 5

medium

Biaya: $0.007
Waktu: 6.4s
Token: 832 tok

Riwayat harga

Data harga historis untuk model ini dari OpenRouter.

Tanggal	Harga input	Harga output
2026-06-30 21:35	$2.000 / 1M	$10.000 / 1M

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Claude Sonnet 5mediumvsQwen3.5 Plus 2026-02-15medium Claude Sonnet 5mediumvsGPT-5.4 Minimedium Claude Sonnet 5mediumvsQwen3.6 Plusmedium Claude Sonnet 5mediumvsNemotron 3 Ultra 550b A55bmediumTersedia gratis Claude Sonnet 5mediumvsClaude Sonnet 4.6medium Claude Sonnet 5mediumvsGemini 3.5 Flashhigh Claude Sonnet 5mediumvsGemini 3 Flash Previewmedium Claude Sonnet 5mediumvsGPT-5.5low

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	10.0	10.0
Pemrograman	9.0	7.9
Gabungan	4.5	2.1
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	7.7	10.0
Kecerdasan umum	4.8	3.2
Kepatuhan instruksi	9.9	10.0
Pemecahan teka-teki	7.7	10.0
Pemanggilan alat	10.0	10.0
Pengetahuan umum	3.0	10.0

Claude Sonnet 5

Hamster playing table tennis

#30 Claude Sonnet 5

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan