AI BENCHY
Advertise here

Kategori AI BENCHY

Peringkat Spesifik domain

Lihat model AI mana yang paling baik di Spesifik domain, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Tes benar ↓.

Model yang ditampilkan

13

Rata-rata Skor Spesifik domain

4.8

Peringkat Model Perusahaan Skor Spesifik domain Skor Tes benar Waktu respons (rata-rata)
#144 GPT-5.4 Mini none OpenAI 3.5 4.9 0/3 937ms
#145 Laguna M.1 none Poolside 3.6 4.8 0/3 5.50s
#147 GPT-4o-mini none OpenAI 3.0 4.8 0/3 637ms
#148 GPT-5.4 Nano none OpenAI 2.9 4.7 0/3 926ms
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 2.9 4.6 0/3 56.7s
#153 Qwen3.6 35B A3B none Qwen 3.5 4.6 0/3 7.45s
#154 Qwen3.5-9B none Qwen 3.0 4.6 0/3 464ms
#156 Hy3 preview none Tencent 3.6 4.4 0/3 17.6s
#158 GLM 4.7 Flash medium Z.ai 3.5 4.4 0/3 174.6s
#159 Ling-2.6-1T none Inclusionai 3.0 4.3 0/3 1.04s
#161 Qwen3.5-9B medium Qwen 3.6 4.2 0/3 137.7s
#162 Nemotron 3 Nano Omni 30b A3b Reasoning none NVIDIA 3.6 4.1 0/3 489ms
#163 Granite 4.1 8B none IBM Granite 3.0 4.0 0/3 357ms

Model teratas menurut Skor Spesifik domain

Skor Spesifik domain vs total biaya

Model teratas menurut Waktu respons (rata-rata)