GPT-5.5

OpenAI Rilis: 2026-04-24 Diuji pada: 2026-04-26 10:23 openai/gpt-5.5::low

(medium) (low) (none)

Ringkasan

GPT-5.5 mendapat skor 9.0 di AI BENCHY dan berada di peringkat #5. Model ini memiliki reliabilitas 10.0, tingkat keberhasilan 87.0%, total biaya $0.681, dan waktu respons rata-rata 8.39s.

Yang membuat GPT-5.5 unik: Ini termasuk salah satu model dengan peringkat keseluruhan tertinggi. Total biaya benchmark-nya sangat rendah untuk kisaran skornya. Model ini terasa cepat dibandingkan model serupa.

Skor

9.0

Konsistensi

9.6

Keandalan

10.0

Total biaya (harga saat ini)

$0.681

Total token output

18,093

Total token input

Harga input

$5.000 / 1M

Harga output

$30.000 / 1M

Tes benar

Tes Salah: 3

Tingkat lulus per percobaan: 87.0%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

8.39s

Waktu respons (maks): 56.19s

Waktu respons (total): 151.01s

Jawaban salah: 2 Tidak mengikuti instruksi: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#5 GPT-5.5

low

Biaya: $0.068
Waktu: 37.0s
Token: 2,339 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-07-16 22:35 Tes baru ditambahkan	9.3	10.0	$1.253	Bandingkan
2026-06-04 13:47 Tes baru ditambahkan	9.0	10.0	$0.907	Bandingkan
2026-05-22 13:31 Suite berubah	8.9	10.0	$0.822	Bandingkan
2026-05-08 15:31 Suite berubah	8.9	10.0	$0.706	Bandingkan
2026-04-26 10:23 Run awal	9.0	10.0	$0.681	Run saat ini

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

GPT-5.5lowvsGPT-5.6 Solhigh GPT-5.5lowvsGemini 3.1 Pro Previewmedium GPT-5.5lowvsGPT-5.6 Solmedium GPT-5.5lowvsClaude Opus 5high GPT-5.5lowvsGemini 3.6 Flashlow GPT-5.5lowvsClaude Opus 5medium GPT-5.5lowvsGPT-5.6 Sollow GPT-5.5lowvsQwen3.7 Maxmedium GPT-5.5lowvsGemini 3.5 Flashhigh GPT-5.5lowvsGemini 3.5 Flashmedium

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	10.0	10.0
Pemrograman	10.0	10.0
Gabungan	10.0	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	5.3	10.0
Kecerdasan umum	10.0	10.0
Kepatuhan instruksi	9.9	10.0
Pemecahan teka-teki	9.0	7.9
Pemanggilan alat	10.0	10.0

GPT-5.5

Hamster playing table tennis

#5 GPT-5.5

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan