AI BENCHY
Advertise here

Kategori AI BENCHY

Peringkat Pemrograman

Lihat model AI mana yang paling baik di Pemrograman, mana yang tetap andal, dan di mana kesenjangan terbesar muncul.

Model yang ditampilkan

15

Rata-rata Skor Pemrograman

6.1

Peringkat Model Perusahaan Skor Pemrograman Skor Tes benar Waktu respons (rata-rata)
#50 Claude Sonnet 4.6 medium Anthropic 6.9 7.6 1/2 33.9s
#100 Seed-2.0-Lite none Bytedance Seed 6.8 5.9 1/2 2.95s
#6 Gemini 3.5 Flash medium Google 6.8 9.0 1/2 9.91s
#67 GPT-5.4 Nano medium OpenAI 6.8 7.2 1/2 21.1s
#71 Seed-2.0-Mini medium Bytedance Seed 6.8 7.1 1/2 220.5s
#116 Kimi K2.6 none Moonshot AI 6.8 5.6 1/2 122.8s
#3 Gemini 3.5 Flash low Google 6.8 9.3 1/2 5.54s
#27 Qwen3.7 Max none Qwen 6.8 7.9 1/2 1.39s
#36 Gemini 3.1 Flash Lite Preview medium Google 6.8 7.7 1/2 3.98s
#37 Gemini 3.1 Flash Lite medium Google 6.8 7.7 1/2 3.59s
#41 Gemini 3 Flash Preview none Google 6.8 7.7 1/2 2.19s
#44 DeepSeek V4 Flash high DeepSeek 6.8 7.6 1/2 58.1s
#46 Gemini 3.1 Flash Lite Preview low Google 6.8 7.6 1/2 1.56s
#52 Gemini 3.1 Flash Lite Preview none Google 6.8 7.5 1/2 1.06s
#53 Gemini 3.1 Flash Lite low Google 6.8 7.4 1/2 1.71s

Model teratas menurut Skor Pemrograman

Skor Pemrograman vs total biaya

Model teratas menurut Waktu respons (rata-rata)