#57

GPT-5.2

OpenAI Rilis: 2025-12-11 Diuji pada: 2026-05-22 00:19 openai/gpt-5.2::medium

Ringkasan

GPT-5.2 mendapat skor 7.4 di AI BENCHY dan berada di peringkat #57. Model ini memiliki reliabilitas 10.0, tingkat keberhasilan 70.0%, total biaya $0.490, dan waktu respons rata-rata 16.44s.

Yang membuat GPT-5.2 unik: Model ini paling menonjol di Pemrograman, dengan peringkat #1, sementara Kecerdasan umum adalah area terlemahnya di #13.

Skor

7.4

Konsistensi

8.3

Keandalan

10.0

Total biaya (harga saat ini)

$0.490

Total token output

31,057

Total token input

Harga input

$1.750 / 1M

Harga output

$14.000 / 1M

Tes benar

Tes Salah: 8

Tingkat lulus per percobaan: 70.0%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

16.44s

Waktu respons (maks): 77.80s

Waktu respons (total): 213.77s

Tidak mengikuti instruksi: 3 Jawaban salah: 3 Tidak ada jawaban: 1 Kedaluwarsa: 1

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#57 GPT-5.2

medium

Biaya: $0.047
Waktu: 49.2s
Token: 3,396 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-06-04 13:45 Tes baru ditambahkan	7.5	10.0	$0.548	Bandingkan
2026-05-22 00:19 Uji ulang	7.4	10.0	$0.490	Run saat ini
2026-04-11 01:44 Run pertama yang tercatat	7.5	T/A	$0.352	Bandingkan

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

GPT-5.2mediumvsStep 3.7 Flashmedium GPT-5.2mediumvsGPT-5.2 Chatnone GPT-5.2mediumvsDeepSeek V4 Flashhigh GPT-5.2mediumvsSeed-2.0-Litemedium GPT-5.2mediumvsGemini 2.5 Flashmedium GPT-5.2mediumvsGemini 3.5 Flashhigh GPT-5.2mediumvsGemini 3 Flash Previewmedium GPT-5.2mediumvsNemotron 3 Ultra 550b A55bmediumTersedia gratis GPT-5.2mediumvsGPT-5.5low

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	6.5	8.0
Pemrograman	10.0	10.0
Gabungan	10.0	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	5.9	7.2
Kecerdasan umum	3.7	9.7
Kepatuhan instruksi	9.9	10.0
Pemecahan teka-teki	7.6	7.3
Pemanggilan alat	4.7	1.6
Pengetahuan umum	3.0	10.0

GPT-5.2

Hamster playing table tennis

#57 GPT-5.2

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan