#47

Claude Sonnet 4.6

Anthropic Rilis: 2026-02-17 Diuji pada: 2026-04-11 01:44 anthropic/claude-sonnet-4.6::none

(medium) (none)

Ringkasan

Claude Sonnet 4.6 mendapat skor 7.4 di AI BENCHY dan berada di peringkat #47. Model ini memiliki reliabilitas T/A, tingkat keberhasilan 64.8%, total biaya $0.262, dan waktu respons rata-rata 4.98s.

Yang membuat Claude Sonnet 4.6 unik: Model ini paling menonjol di Pemrograman, dengan peringkat #1, sementara Trik anti-AI adalah area terlemahnya di #17. Model ini terasa cepat dibandingkan model serupa.

Skor

7.4

Konsistensi

9.6

Keandalan

T/A

Total biaya (harga saat ini)

$0.262

Total token output

7,433

Total token input

Harga input

$3.000 / 1M

Harga output

$15.000 / 1M

Tes benar

Tes Salah: 7

Tingkat lulus per percobaan: 64.8%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

4.98s

Waktu respons (maks): 23.84s

Waktu respons (total): 54.83s

Format tambahan: 3 Jawaban salah: 3 Tidak mengikuti instruksi: 1

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#47 Claude Sonnet 4.6

none

Biaya: $0.038
Waktu: 27.3s
Token: 2,598 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-06-04 13:40 Tes baru ditambahkan	6.8	10.0	$0.316	Bandingkan
2026-05-22 00:12 Suite berubah	7.0	10.0	$0.306	Bandingkan
2026-04-11 01:44 Run pertama yang tercatat	7.4	T/A	$0.262	Run saat ini

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Claude Sonnet 4.6nonevsMiMo-V2.5-Promedium Claude Sonnet 4.6nonevsGrok 4.20medium Claude Sonnet 4.6nonevsSeed-2.0-Minimedium Claude Sonnet 4.6nonevsGemini 3.5 Flashhigh Claude Sonnet 4.6nonevsGemini 3 Flash Previewmedium Claude Sonnet 4.6nonevsNemotron 3 Ultra 550b A55bmediumTersedia gratis Claude Sonnet 4.6nonevsGPT-5.5low

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	4.8	10.0
Pemrograman	10.0	10.0
Gabungan	9.5	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	7.7	10.0
Kecerdasan umum	6.1	3.1
Kepatuhan instruksi	6.5	10.0
Pemecahan teka-teki	7.7	10.0
Pemanggilan alat	10.0	10.0

Claude Sonnet 4.6

Hamster playing table tennis

#47 Claude Sonnet 4.6

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan