AI BENCHY
Advertise here

Kategori AI BENCHY

Peringkat Kecerdasan umum

Lihat model AI mana yang paling baik di Kecerdasan umum, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Metrik ↑.

Model yang ditampilkan

13

Rata-rata Skor Kecerdasan umum

5.9

Model terbaik

Qwen3.5-35B-A3B 2.8
Peringkat Model Perusahaan Skor Kecerdasan umum Skor Tes benar Waktu respons (rata-rata)
#55 GLM 5.1 medium Z.ai 10.0 7.3 1/1 20.9s
#59 GLM 5V Turbo medium Z.ai 10.0 7.2 1/1 11.1s
#60 Kimi K2.6 medium Moonshot AI 10.0 7.2 1/1 17.8s
#68 Claude Opus 4.8 none Anthropic 10.0 7.0 1/1 3.48s
#69 Claude Opus 4.6 medium Anthropic 10.0 7.0 1/1 5.04s
#85 Gemma 4 31B none Google 10.0 6.5 1/1 2.09s
#91 GPT-5.5 none OpenAI 10.0 6.4 1/1 3.41s
#98 GLM 5 none Z.ai 10.0 6.1 1/1 3.27s
#108 Qwen3.5-Flash none Qwen 10.0 5.8 1/1 803ms
#110 Seed-2.0-Lite none Bytedance Seed 10.0 5.8 1/1 3.45s
#128 Qwen3.6 Flash none Qwen 10.0 5.4 1/1 947ms
#135 Kimi K2.5 none Moonshot AI 10.0 5.2 1/1 4.00s
#140 Qwen3 Coder Next none Qwen 10.0 4.9 1/1 1.34s

Model teratas menurut Skor Kecerdasan umum

Skor Kecerdasan umum vs total biaya

Model teratas menurut Waktu respons (rata-rata)