Claude Opus 4.7

Anthropic Rilis: 2026-04-16 Diuji pada: 2026-04-16 15:59 anthropic/claude-opus-4.7::none

(medium) (none)

Ringkasan

Claude Opus 4.7 mendapat skor 9.2 di AI BENCHY dan berada di peringkat #4. Model ini memiliki reliabilitas T/A, tingkat keberhasilan 88.9%, total biaya $0.505, dan waktu respons rata-rata 3.13s.

Yang membuat Claude Opus 4.7 unik: Model ini paling menonjol di Spesifik domain, dengan peringkat #2, sementara Trik anti-AI adalah area terlemahnya di #12. Ini termasuk salah satu model dengan peringkat keseluruhan tertinggi. Total biaya benchmark-nya sangat rendah untuk kisaran skornya.

Model diarsipkan: model ini tidak lagi diperbarui atau diuji pada pengujian baru.

Skor

9.2

Konsistensi

10.0

Keandalan

T/A

Total biaya (harga saat ini)

$0.505

Total token output

6,326

Total token input

Harga input

$5.000 / 1M

Harga output

$25.000 / 1M

Tes benar

Tes Salah: 2

Tingkat lulus per percobaan: 88.9%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

3.13s

Waktu respons (maks): 18.27s

Waktu respons (total): 56.33s

Jawaban salah: 2

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#4 Claude Opus 4.7

none

Biaya: $0.051
Waktu: 24.2s
Token: 2,181 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-05-08 13:36 Uji ulang	8.9	10.0	$0.505	Bandingkan
2026-05-08 13:36 Uji ulang	8.9	10.0	$0.507	Bandingkan
2026-05-08 13:36 Suite berubah	8.9	10.0	$0.507	Bandingkan
2026-04-16 15:59 Run pertama yang tercatat	9.2	T/A	$0.505	Run saat ini

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Claude Opus 4.7nonevsGemini 3.5 Flashhigh Claude Opus 4.7nonevsGemini 3 Flash Previewmedium Claude Opus 4.7nonevsNemotron 3 Ultra 550b A55bmediumTersedia gratis Claude Opus 4.7nonevsGPT-5.5low

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	8.3	10.0
Pemrograman	10.0	10.0
Gabungan	9.5	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	7.7	10.0
Kecerdasan umum	10.0	10.0
Kepatuhan instruksi	10.0	10.0
Pemecahan teka-teki	10.0	10.0
Pemanggilan alat	10.0	10.0

Claude Opus 4.7

Hamster playing table tennis

#4 Claude Opus 4.7

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan