AI BENCHY
Bandingkan
❤️ Made by XCS
Your ad here

Nama Model

OpenAI: GPT-5.3-Codex

Penalaran (medium)

Benchmark dihasilkan dari suite pengujian AI BENCHY pada : 24 Feb 2026

Metrik OpenAI: GPT-5.3-Codex
Peringkat#6
PerusahaanOpenAI
Score 7.77
Konsistensi 8.75
Biaya per hasil 4.9342
Total Biaya $0.44408
Tes benar
Tingkat lulus per percobaan 76.9%
Tes tidak stabil 2
Token output 947
Token penalaran 29,564
Waktu respons (rata-rata)17944ms
Waktu respons (total)233267ms
Waktu respons (maks)100927ms

Rincian Kategori

Kategori Tes lulus penuh Score Konsistensi Tingkat lulus per percobaan Tes tidak stabil Skor penalaran Waktu respons (rata-rata) Biaya
Trik anti-AI 10.00 10.00 100.0% 0 6.00 4687ms $0.02371
Parsing dan ekstraksi data 10.00 10.00 100.0% 0 1.25 3180ms $0.02600
Spesifik domain 4.00 7.21 55.6% 1 1.00 64314ms $0.35664
Kepatuhan instruksi 9.00 10.00 50.0% 0 1.00 3037ms $0.01216
Puzzle Solving 7.00 7.38 77.8% 1 6.00 4610ms $0.02559

Model yang Dibandingkan

Bandingkan OpenAI: GPT-5.3-Codex dengan...

#5 · Google

Google: Gemini 3 Flash Preview

Penalaran (low)

Score: 8.23

Konsistensi: 8.71

Tingkat lulus per percobaan: 82.0%

Tes tidak stabil: 2

Biaya per hasil: 0.6173

Tes benar:

Total Biaya: $0.06174

Bandingkan

#7 · OpenAI

OpenAI: GPT-5.2

Penalaran (medium)

Score: 7.38

Konsistensi: 8.73

Tingkat lulus per percobaan: 76.9%

Tes tidak stabil: 2

Biaya per hasil: 2.5637

Tes benar:

Total Biaya: $0.23074

Bandingkan

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Penalaran (medium)

Score: 8.54

Konsistensi: 9.35

Tingkat lulus per percobaan: 87.2%

Tes tidak stabil: 1

Biaya per hasil: 2.1621

Tes benar:

Total Biaya: $0.23784

Bandingkan

Perbandingan Cepat

Bandingkan OpenAI: GPT-5.3-Codex dengan...