Peringkat model Pemrograman

Kategori AI BENCHY

Lihat model AI mana yang paling baik di Pemrograman, mana yang tetap andal, dan di mana kesenjangan terbesar muncul.

Model yang ditampilkan

Rata-rata Skor Pemrograman

5.7

Model terbaik

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah230 Dengan alasan kegagalan Kesalahan API43 Dengan alasan kegagalan Kedaluwarsa25 Dengan alasan kegagalan Tidak ada jawaban18 Dengan alasan kegagalan Tidak mengikuti instruksi16 Dengan alasan kegagalan Format tambahan12

189/189

Peringkat	Model	Perusahaan	Skor Pemrograman	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#54	Grok Build 0.1 medium	X AI	5.7	7.6	$0.927	1/3	108.5s
Total Tes 3 Tes Salah 2 Total Biaya $0.927 Waktu respons (rata-rata) 108.5s
#147	MiniMax M2.7 medium	Minimax	5.7	5.2	$0.100	1/3	101.9s
Total Tes 3 Tes Salah 2 Total Biaya $0.100 Waktu respons (rata-rata) 101.9s
#127	Owl Alpha none	Openrouter	5.6	5.8	$0.000	1/3	36.9s
Total Tes 3 Tes Salah 2 Total Biaya $0.000 Waktu respons (rata-rata) 36.9s
#85	Gemini 3.5 Flash minimal	Google	5.6	6.8	$0.108	1/3	2.75s
Total Tes 3 Tes Salah 2 Total Biaya $0.108 Waktu respons (rata-rata) 2.75s
#71	DeepSeek V4 Pro none	DeepSeek	5.6	7.2	$0.034	1/3	13.4s
Total Tes 3 Tes Salah 2 Total Biaya $0.034 Waktu respons (rata-rata) 13.4s
#107	Seed-2.0-Lite none	Bytedance Seed	5.6	6.2	$0.019	1/3	2.83s
Total Tes 3 Tes Salah 2 Total Biaya $0.019 Waktu respons (rata-rata) 2.83s
#58	GPT-5.3 Chat none	OpenAI	5.6	7.5	$0.433	1/3	10.5s
Total Tes 3 Tes Salah 2 Total Biaya $0.433 Waktu respons (rata-rata) 10.5s
#63	Seed-2.0-Mini medium	Bytedance Seed	5.5	7.4	$0.044	1/3	220.5s
Total Tes 3 Tes Salah 2 Total Biaya $0.044 Waktu respons (rata-rata) 220.5s
#128	Kimi K2.6 none	Moonshot AI	5.5	5.8	$0.078	1/3	82.6s
Total Tes 3 Tes Salah 2 Total Biaya $0.078 Waktu respons (rata-rata) 82.6s
#41	Gemini 3.1 Flash Lite Preview medium	Google	5.5	7.8	$0.068	1/3	4.09s
Total Tes 3 Tes Salah 2 Total Biaya $0.068 Waktu respons (rata-rata) 4.09s
#43	Gemini 3.1 Flash Lite medium	Google	5.5	7.8	$0.071	1/3	3.81s
Total Tes 3 Tes Salah 2 Total Biaya $0.071 Waktu respons (rata-rata) 3.81s
#68	Claude Sonnet 4.6 none	Anthropic	5.5	7.3	$0.316	1/3	5.19s
Total Tes 3 Tes Salah 2 Total Biaya $0.316 Waktu respons (rata-rata) 5.19s
#70	Claude Opus 4.8 none	Anthropic	5.5	7.2	$0.539	1/3	3.29s
Total Tes 3 Tes Salah 2 Total Biaya $0.539 Waktu respons (rata-rata) 3.29s
#73	Qwen3.7 Plus none	Qwen	5.5	7.2	$0.023	1/3	2.15s
Total Tes 3 Tes Salah 2 Total Biaya $0.023 Waktu respons (rata-rata) 2.15s
#78	Laguna XS 2.1 medium	Poolside	5.5	7.0	$0.036	1/3	70.3s
Total Tes 3 Tes Salah 2 Total Biaya $0.036 Waktu respons (rata-rata) 70.3s

Peringkat Pemrograman

Filter model

Model teratas menurut Skor Pemrograman

Skor Pemrograman vs total biaya

Model teratas menurut Waktu respons (rata-rata)