AI BENCHY
Advertise here

Kategori AI BENCHY

Peringkat Gabungan

Lihat model AI mana yang paling baik di Gabungan, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Waktu respons (rata-rata) ↑.

Model yang ditampilkan

15

Rata-rata Skor Gabungan

6.3

Peringkat Model Perusahaan Skor Gabungan Skor Tes benar Waktu respons (rata-rata)
#142 Mistral Small 4 none Mistral 3.0 4.9 0/1 1.72s
#163 Granite 4.1 8B none IBM Granite 3.0 4.0 0/1 1.88s
#146 Laguna Xs.2 none Poolside 3.0 4.8 0/1 2.01s
#34 Qwen3.7 Max none Qwen 3.0 7.7 0/1 2.17s
#143 MiMo-V2.5 none Xiaomi 3.0 4.9 0/1 2.36s
#144 GPT-5.4 Mini none OpenAI 3.0 4.9 0/1 2.52s
#87 Gemini 3.1 Flash Lite minimal Google 3.0 6.4 0/1 2.53s
#90 Gemini 3.1 Flash Lite none Google 3.0 6.4 0/1 2.73s
#152 MiMo-V2-Flash none Xiaomi 3.0 4.6 0/1 2.87s
#125 GPT-5.4 none OpenAI 3.0 5.5 0/1 2.89s
#58 Gemini 3.1 Flash Lite Preview none Google 3.0 7.2 0/1 3.20s
#122 GLM 4.7 Flash none Z.ai 3.0 5.5 0/1 3.22s
#16 Gemini 3 Flash Preview low Google 3.0 8.4 0/1 3.27s
#81 Mercury 2 medium Inception 10.0 6.6 1/1 3.28s
#157 Grok 4.1 Fast none X AI 3.0 4.4 0/1 3.33s

Model teratas menurut Skor Gabungan

Skor Gabungan vs total biaya

Model teratas menurut Waktu respons (rata-rata)