AI BENCHY
Advertise here

Kategori AI BENCHY

Peringkat Kecerdasan umum

Lihat model AI mana yang paling baik di Kecerdasan umum, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Tes benar ↑.

Model yang ditampilkan

15

Rata-rata Skor Kecerdasan umum

5.9

Model terbaik

GPT-5.3-Codex 4.6
Peringkat Model Perusahaan Skor Kecerdasan umum Skor Tes benar Waktu respons (rata-rata)
#79 Hunter Alpha medium OpenRouter 7.0 6.7 0/1 6.44s
#80 Mimo V2 Omni medium Xiaomi 5.4 6.7 0/1 3.61s
#81 Mercury 2 medium Inception 4.8 6.6 0/1 821ms
#82 Hy3 preview high Tencent 3.0 6.6 0/1 0ms
#83 Step 3.5 Flash none Stepfun 4.0 6.6 0/1 14.4s
#84 Grok 4.20 Multi Agent Beta medium X AI 5.8 6.6 0/1 6.40s
#86 Grok 4.1 Fast medium X AI 4.2 6.5 0/1 16.2s
#87 Gemini 3.1 Flash Lite minimal Google 4.0 6.4 0/1 791ms
#88 Qwen3.7 Plus none Qwen 5.3 6.4 0/1 1.33s
#89 Hy3 preview low Tencent 3.0 6.4 0/1 0ms
#90 Gemini 3.1 Flash Lite none Google 4.0 6.4 0/1 992ms
#92 Laguna M.1 medium Poolside 3.0 6.4 0/1 0ms
#93 Qwen3.6 Plus Preview medium Qwen 3.0 6.3 0/1 0ms
#94 GPT-5 Nano medium OpenAI 4.1 6.3 0/1 17.5s
#95 Qwen3.5 Plus 2026-02-15 none Qwen 4.4 6.3 0/1 2.26s

Model teratas menurut Skor Kecerdasan umum

Skor Kecerdasan umum vs total biaya

Model teratas menurut Waktu respons (rata-rata)