Peringkat model Pemrograman

Kategori AI BENCHY

Lihat model AI mana yang paling baik di Pemrograman, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Tes benar ↓.

Model yang ditampilkan

Rata-rata Skor Pemrograman

5.7

Model terbaik

Gemini 3.5 Flash 10.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah230 Dengan alasan kegagalan Kesalahan API43 Dengan alasan kegagalan Kedaluwarsa25 Dengan alasan kegagalan Tidak ada jawaban18 Dengan alasan kegagalan Tidak mengikuti instruksi16 Dengan alasan kegagalan Format tambahan12

189/189

Peringkat	Model	Perusahaan	Skor Pemrograman	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#115	Nemotron 3 Ultra 550b A55b none	NVIDIA	5.5	6.1	$0.027	1/3	1.02s
Total Tes 3 Tes Salah 2 Total Biaya $0.027 Waktu respons (rata-rata) 1.02s
#117	GPT-5.6 Terra none	OpenAI	5.5	6.0	$0.130	1/3	1.00s
Total Tes 3 Tes Salah 2 Total Biaya $0.130 Waktu respons (rata-rata) 1.00s
#119	Qwen3.6 Flash none	Qwen	5.4	6.0	$0.015	1/3	1.79s
Total Tes 3 Tes Salah 2 Total Biaya $0.015 Waktu respons (rata-rata) 1.79s
#120	Qwen3.5-35B-A3B none	Qwen	5.5	5.9	$0.012	1/3	1.39s
Total Tes 3 Tes Salah 2 Total Biaya $0.012 Waktu respons (rata-rata) 1.39s
#121	Qwen3.5-27B none	Qwen	5.8	5.9	$0.015	1/3	1.80s
Total Tes 3 Tes Salah 2 Total Biaya $0.015 Waktu respons (rata-rata) 1.80s
#122	GLM 5V Turbo none	Z.ai	5.5	5.9	$0.052	1/3	3.13s
Total Tes 3 Tes Salah 2 Total Biaya $0.052 Waktu respons (rata-rata) 3.13s
#125	Owl Alpha medium	Openrouter	5.4	5.8	$0.000	1/3	18.7s
Total Tes 3 Tes Salah 2 Total Biaya $0.000 Waktu respons (rata-rata) 18.7s
#126	Mimo V2 PRO none	Xiaomi	5.5	5.8	$0.045	1/3	2.65s
Total Tes 3 Tes Salah 2 Total Biaya $0.045 Waktu respons (rata-rata) 2.65s
#127	Owl Alpha none	Openrouter	5.6	5.8	$0.000	1/3	36.9s
Total Tes 3 Tes Salah 2 Total Biaya $0.000 Waktu respons (rata-rata) 36.9s
#128	Kimi K2.6 none	Moonshot AI	5.5	5.8	$0.078	1/3	82.6s
Total Tes 3 Tes Salah 2 Total Biaya $0.078 Waktu respons (rata-rata) 82.6s
#129	GPT-5.4 none	OpenAI	5.5	5.8	$0.122	1/3	1.62s
Total Tes 3 Tes Salah 2 Total Biaya $0.122 Waktu respons (rata-rata) 1.62s
#136	Kimi K2.5 none	Moonshot AI	5.5	5.5	$0.027	1/3	24.6s
Total Tes 3 Tes Salah 2 Total Biaya $0.027 Waktu respons (rata-rata) 24.6s
#138	Qwen3.6 27B none	Qwen	5.5	5.5	$0.025	1/3	4.16s
Total Tes 3 Tes Salah 2 Total Biaya $0.025 Waktu respons (rata-rata) 4.16s
#144	GPT-5.4 Mini none	OpenAI	5.5	5.3	$0.038	1/3	913ms
Total Tes 3 Tes Salah 2 Total Biaya $0.038 Waktu respons (rata-rata) 913ms
#147	MiniMax M2.7 medium	Minimax	5.7	5.2	$0.100	1/3	101.9s
Total Tes 3 Tes Salah 2 Total Biaya $0.100 Waktu respons (rata-rata) 101.9s

Peringkat Pemrograman

Filter model

Model teratas menurut Skor Pemrograman

Skor Pemrograman vs total biaya

Model teratas menurut Waktu respons (rata-rata)