#45

GPT-5.2

OpenAI Rilis: 2025-12-11 Diuji pada: 2026-04-11 01:44 openai/gpt-5.2::medium

Ringkasan

GPT-5.2 mendapat skor 7.5 di AI BENCHY dan berada di peringkat #45. Model ini memiliki reliabilitas T/A, tingkat keberhasilan 72.2%, total biaya $0.352, dan waktu respons rata-rata 14.04s.

Yang membuat GPT-5.2 unik: Model ini paling menonjol di Pemrograman, dengan peringkat #1, sementara Pemanggilan alat adalah area terlemahnya di #17.

Skor

7.5

Konsistensi

8.1

Keandalan

T/A

Total biaya (harga saat ini)

$0.352

Total token output

21,682

Total token input

Harga input

$1.750 / 1M

Harga output

$14.000 / 1M

Tes benar

Tes Salah: 7

Tingkat lulus per percobaan: 72.2%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

14.04s

Waktu respons (maks): 77.80s

Waktu respons (total): 154.41s

Tidak mengikuti instruksi: 3 Jawaban salah: 2 Tidak ada jawaban: 1 Kedaluwarsa: 1

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#45 GPT-5.2

medium

Biaya: $0.047
Waktu: 49.2s
Token: 3,396 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-06-04 13:45 Tes baru ditambahkan	7.5	10.0	$0.548	Bandingkan
2026-05-22 00:19 Uji ulang	7.4	10.0	$0.490	Bandingkan
2026-04-11 01:44 Run pertama yang tercatat	7.5	T/A	$0.352	Run saat ini

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

GPT-5.2mediumvsStep 3.7 Flashmedium GPT-5.2mediumvsGPT-5.2 Chatnone GPT-5.2mediumvsDeepSeek V4 Flashhigh GPT-5.2mediumvsSeed-2.0-Litemedium GPT-5.2mediumvsGemini 2.5 Flashmedium GPT-5.2mediumvsGemini 3.5 Flashhigh GPT-5.2mediumvsGemini 3 Flash Previewmedium GPT-5.2mediumvsNemotron 3 Ultra 550b A55bmediumTersedia gratis GPT-5.2mediumvsGPT-5.5low

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	6.5	8.0
Pemrograman	10.0	10.0
Gabungan	10.0	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	5.9	7.2
Kecerdasan umum	3.7	9.7
Kepatuhan instruksi	9.9	10.0
Pemecahan teka-teki	7.7	7.3
Pemanggilan alat	4.7	1.6

GPT-5.2

Hamster playing table tennis

#45 GPT-5.2

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan