AI BENCHY
Bandingkan Grafik
โค๏ธ Made by XCS
Your ad here

#33

GPT-5 Mini

OpenAI ยท Rilis: 2025-08-07 ยท openai/gpt-5-mini::medium

Skor Rata-rata

5.77

Biaya per hasil

1.200

Konsistensi

8.80

Total Biaya

$0.084

Tes benar

7

Tes dianggap lulus penuh hanya jika semua run-nya lulus.

Tes Salah

7

Tingkat lulus per percobaan: 57.1%

Tes tidak stabil

2

Waktu respons: rata-rata 21.47s ยท total 300.64s ยท maks 82.55s

Tidak mengikuti instruksi: 3 Jawaban salah: 3 Kedaluwarsa: 1

Model teratas berdasarkan skor

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Perbandingan Cepat

Rincian Kategori

Kategori Skor Rata-rata Konsistensi Tes benar
Anti-AI Tricks 7.00 9.62 2/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 1.00 7.21 0/3
Instructions following 7.00 6.64 1/2
Puzzle Solving 4.34 9.78 1/3
Tool Calling 10.00 10.00 1/1