Peringkat model Pemrograman

Kategori AI BENCHY

Lihat model AI mana yang paling baik di Pemrograman, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Waktu respons (rata-rata) ↑.

Model yang ditampilkan

Rata-rata Skor Pemrograman

5.7

Model terbaik

Gemini 3 PRO Preview 3.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah230 Dengan alasan kegagalan Kesalahan API43 Dengan alasan kegagalan Kedaluwarsa25 Dengan alasan kegagalan Tidak ada jawaban18 Dengan alasan kegagalan Tidak mengikuti instruksi16 Dengan alasan kegagalan Format tambahan12

189/189

Peringkat	Model	Perusahaan	Skor Pemrograman	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#70	Claude Opus 4.8 none	Anthropic	5.5	7.2	$0.539	1/3	3.29s
Total Tes 3 Tes Salah 2 Total Biaya $0.539 Waktu respons (rata-rata) 3.29s
#132	Claude Sonnet 5 none	Anthropic	4.6	5.7	$0.287	0/3	3.67s
Total Tes 3 Tes Salah 3 Total Biaya $0.287 Waktu respons (rata-rata) 3.67s
#43	Gemini 3.1 Flash Lite medium	Google	5.5	7.8	$0.071	1/3	3.81s
Total Tes 3 Tes Salah 2 Total Biaya $0.071 Waktu respons (rata-rata) 3.81s
#41	Gemini 3.1 Flash Lite Preview medium	Google	5.5	7.8	$0.068	1/3	4.09s
Total Tes 3 Tes Salah 2 Total Biaya $0.068 Waktu respons (rata-rata) 4.09s
#139	Gemma 4 26B A4B none	Google	3.7	5.5	$0.004	0/3	4.16s
Total Tes 3 Tes Salah 3 Total Biaya $0.004 Waktu respons (rata-rata) 4.16s
#138	Qwen3.6 27B none	Qwen	5.5	5.5	$0.025	1/3	4.16s
Total Tes 3 Tes Salah 2 Total Biaya $0.025 Waktu respons (rata-rata) 4.16s
#178	Hy3 preview none	Tencent	2.7	4.3	$0.003	0/3	4.56s
Total Tes 3 Tes Salah 3 Total Biaya $0.003 Waktu respons (rata-rata) 4.56s
#108	GPT-5.6 Luna low	OpenAI	5.5	6.2	$0.141	1/3	4.61s
Total Tes 3 Tes Salah 2 Total Biaya $0.141 Waktu respons (rata-rata) 4.61s
#134	GLM 5.1 none	Z.ai	3.9	5.6	$0.057	0/3	4.96s
Total Tes 3 Tes Salah 3 Total Biaya $0.057 Waktu respons (rata-rata) 4.96s
#118	GLM 5 none	Z.ai	4.0	6.0	$0.027	0/3	5.12s
Total Tes 3 Tes Salah 3 Total Biaya $0.027 Waktu respons (rata-rata) 5.12s
#68	Claude Sonnet 4.6 none	Anthropic	5.5	7.3	$0.316	1/3	5.19s
Total Tes 3 Tes Salah 2 Total Biaya $0.316 Waktu respons (rata-rata) 5.19s
#155	Qwen3.5-9B none	Qwen	3.9	5.1	$0.006	0/3	5.60s
Total Tes 3 Tes Salah 3 Total Biaya $0.006 Waktu respons (rata-rata) 5.60s
#65	Gemini 3 Flash Preview low	Google	5.8	7.4	$0.111	1/3	6.00s
Total Tes 3 Tes Salah 2 Total Biaya $0.111 Waktu respons (rata-rata) 6.00s
#8	Gemini 3.5 Flash low	Google	7.8	9.2	$0.349	2/3	6.71s
Total Tes 3 Tes Salah 1 Total Biaya $0.349 Waktu respons (rata-rata) 6.71s
#38	GPT-5.6 Terra medium	OpenAI	6.1	7.8	$0.496	1/3	7.19s
Total Tes 3 Tes Salah 2 Total Biaya $0.496 Waktu respons (rata-rata) 7.19s

Peringkat Pemrograman

Filter model

Model teratas menurut Skor Pemrograman

Skor Pemrograman vs total biaya

Model teratas menurut Waktu respons (rata-rata)