Peringkat model Pemrograman

Kategori AI BENCHY

Lihat model AI mana yang paling baik di Pemrograman, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Tes benar ↑.

Model yang ditampilkan

Rata-rata Skor Pemrograman

5.7

Model terbaik

Qwen3.6 Flash 5.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah230 Dengan alasan kegagalan Kesalahan API43 Dengan alasan kegagalan Kedaluwarsa25 Dengan alasan kegagalan Tidak ada jawaban18 Dengan alasan kegagalan Tidak mengikuti instruksi16 Dengan alasan kegagalan Format tambahan12

189/189

Peringkat	Model	Perusahaan	Skor Pemrograman	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#168	Qwen3 Coder Next medium	Qwen	3.7	4.7	$0.008	0/3	924ms
Total Tes 3 Tes Salah 3 Total Biaya $0.008 Waktu respons (rata-rata) 924ms
#169	Grok 4.20 Beta none	X AI	1.8	4.7	$0.087	0/1	1.14s
Total Tes 1 Tes Salah 1 Total Biaya $0.087 Waktu respons (rata-rata) 1.14s
#170	Laguna M.1 none	Poolside	2.5	4.6	$0.009	0/1	2.93s
Total Tes 1 Tes Salah 1 Total Biaya $0.009 Waktu respons (rata-rata) 2.93s
#171	Mercury 2 none	Inception	3.4	4.6	$0.011	0/3	1.03s
Total Tes 3 Tes Salah 3 Total Biaya $0.011 Waktu respons (rata-rata) 1.03s
#172	Elephant Alpha none	Openrouter	4.2	4.6	$0.000	0/3	1.39s
Total Tes 3 Tes Salah 3 Total Biaya $0.000 Waktu respons (rata-rata) 1.39s
#173	Elephant Alpha medium	Openrouter	3.7	4.5	$0.000	0/3	1.30s
Total Tes 3 Tes Salah 3 Total Biaya $0.000 Waktu respons (rata-rata) 1.30s
#174	Hunter Alpha none	OpenRouter	9.8	4.5	$0.000	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.000 Waktu respons (rata-rata) 0ms
#175	Grok 4.20 none	X AI	1.1	4.4	$0.057	0/1	1.22s
Total Tes 1 Tes Salah 1 Total Biaya $0.057 Waktu respons (rata-rata) 1.22s
#176	Laguna Xs.2 medium	Poolside	2.1	4.3	$0.015	0/1	14.4s
Total Tes 1 Tes Salah 1 Total Biaya $0.015 Waktu respons (rata-rata) 14.4s
#177	GLM 4.7 Flash medium	Z.ai	3.2	4.3	$0.054	0/3	55.3s
Total Tes 3 Tes Salah 3 Total Biaya $0.054 Waktu respons (rata-rata) 55.3s
#178	Hy3 preview none	Tencent	2.7	4.3	$0.003	0/3	4.56s
Total Tes 3 Tes Salah 3 Total Biaya $0.003 Waktu respons (rata-rata) 4.56s
#179	MiMo-V2-Flash none	Xiaomi	4.3	4.3	$0.025	0/3	2.64s
Total Tes 3 Tes Salah 3 Total Biaya $0.025 Waktu respons (rata-rata) 2.64s
#181	Grok 4.1 Fast none	X AI	1.8	4.0	$0.008	0/1	1.79s
Total Tes 1 Tes Salah 1 Total Biaya $0.008 Waktu respons (rata-rata) 1.79s
#182	Laguna Xs.2 none	Poolside	8.3	4.0	$0.004	0/1	1.96s
Total Tes 1 Tes Salah 1 Total Biaya $0.004 Waktu respons (rata-rata) 1.96s
#183	Granite 4.1 8B none	IBM Granite	4.5	4.0	$0.003	0/3	775ms
Total Tes 3 Tes Salah 3 Total Biaya $0.003 Waktu respons (rata-rata) 775ms

Peringkat Pemrograman

Filter model

Model teratas menurut Skor Pemrograman

Skor Pemrograman vs total biaya

Model teratas menurut Waktu respons (rata-rata)