Peringkat model Pemrograman

Kategori AI BENCHY

Lihat model AI mana yang paling baik di Pemrograman, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Waktu respons (rata-rata) ↑.

Model yang ditampilkan

Rata-rata Skor Pemrograman

5.7

Model terbaik

Gemini 3 PRO Preview 3.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah230 Dengan alasan kegagalan Kesalahan API43 Dengan alasan kegagalan Kedaluwarsa25 Dengan alasan kegagalan Tidak ada jawaban18 Dengan alasan kegagalan Tidak mengikuti instruksi16 Dengan alasan kegagalan Format tambahan12

189/189

Peringkat	Model	Perusahaan	Skor Pemrograman	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#74	GLM 5.2 none	Z.ai	3.7	7.1	$0.042	0/3	7.55s
Total Tes 3 Tes Salah 3 Total Biaya $0.042 Waktu respons (rata-rata) 7.55s
#46	Claude Opus 4.8 low	Anthropic	6.6	7.7	$1.270	1/3	7.58s
Total Tes 3 Tes Salah 2 Total Biaya $1.270 Waktu respons (rata-rata) 7.58s
#148	Qwen3.6 35B A3B none	Qwen	5.5	5.2	$0.031	1/3	8.77s
Total Tes 3 Tes Salah 2 Total Biaya $0.031 Waktu respons (rata-rata) 8.77s
#29	GPT-5.6 Terra high	OpenAI	7.6	8.2	$0.852	2/3	9.14s
Total Tes 3 Tes Salah 1 Total Biaya $0.852 Waktu respons (rata-rata) 9.14s
#5	GPT-5.6 Sol medium	OpenAI	10.0	9.4	$0.966	3/3	9.40s
Total Tes 3 Tes Salah 0 Total Biaya $0.966 Waktu respons (rata-rata) 9.40s
#50	Step 3.7 Flash low	Stepfun	8.2	7.7	$0.341	2/3	9.46s
Total Tes 3 Tes Salah 1 Total Biaya $0.341 Waktu respons (rata-rata) 9.46s
#48	GPT-5.6 Terra low	OpenAI	6.6	7.7	$0.343	1/3	9.56s
Total Tes 3 Tes Salah 2 Total Biaya $0.343 Waktu respons (rata-rata) 9.56s
#184	gpt-oss-120b none	OpenAI	1.5	4.0	$0.010	0/1	9.57s
Total Tes 1 Tes Salah 1 Total Biaya $0.010 Waktu respons (rata-rata) 9.57s
#22	GPT-5.2 Chat none	OpenAI	8.8	8.5	$0.393	2/3	9.82s
Total Tes 3 Tes Salah 1 Total Biaya $0.393 Waktu respons (rata-rata) 9.82s
#55	GPT-5.6 Luna medium	OpenAI	5.4	7.6	$0.258	1/3	10.4s
Total Tes 3 Tes Salah 2 Total Biaya $0.258 Waktu respons (rata-rata) 10.4s
#58	GPT-5.3 Chat none	OpenAI	5.6	7.5	$0.433	1/3	10.5s
Total Tes 3 Tes Salah 2 Total Biaya $0.433 Waktu respons (rata-rata) 10.5s
#167	Ling-2.6-1T none	Inclusionai	3.8	4.7	$0.005	0/3	10.6s
Total Tes 3 Tes Salah 3 Total Biaya $0.005 Waktu respons (rata-rata) 10.6s
#75	MiMo-V2-Flash medium	Xiaomi	6.0	7.1	$0.043	1/3	10.7s
Total Tes 3 Tes Salah 2 Total Biaya $0.043 Waktu respons (rata-rata) 10.7s
#114	Gemma 4 31B none	Google	5.5	6.1	$0.004	1/3	11.2s
Total Tes 3 Tes Salah 2 Total Biaya $0.004 Waktu respons (rata-rata) 11.2s
#163	Ling-2.6-flash none	Inclusionai	5.3	4.9	$0.001	1/3	11.2s
Total Tes 3 Tes Salah 2 Total Biaya $0.001 Waktu respons (rata-rata) 11.2s

Peringkat Pemrograman

Filter model

Model teratas menurut Skor Pemrograman

Skor Pemrograman vs total biaya

Model teratas menurut Waktu respons (rata-rata)