AI BENCHY
Your ad here

Kategori AI BENCHY

Peringkat Gabungan

Lihat model AI mana yang paling baik di Gabungan, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Tes benar ↓.

Model yang ditampilkan

15

Rata-rata Skor Gabungan

6.2

Peringkat Model Perusahaan Skor Gabungan Skor Tes benar Waktu respons (rata-rata)
#39 Seed-2.0-Mini medium Bytedance Seed 10.0 7.5 1/1 262.8s
#40 GPT-5.2 medium OpenAI 10.0 7.5 1/1 14.1s
#41 MiMo-V2-Flash medium Xiaomi 9.8 7.5 1/1 75.7s
#42 Claude Sonnet 4.6 none Anthropic 9.5 7.4 1/1 23.8s
#44 GPT-5.4 Mini medium OpenAI 10.0 7.3 1/1 17.8s
#45 GPT-5 Mini medium OpenAI 10.0 7.0 1/1 88.2s
#46 Kimi K2.5 medium Moonshot AI 10.0 7.0 1/1 71.4s
#47 Grok 4.20 medium X AI 10.0 7.0 1/1 17.4s
#51 Nemotron 3 Super medium NVIDIA 10.0 6.7 1/1 87.8s
#52 Grok 4.1 Fast medium X AI 10.0 6.7 1/1 37.6s
#54 Mercury 2 medium Inception 10.0 6.5 1/1 3.28s
#57 GPT-5 Nano medium OpenAI 10.0 6.3 1/1 66.0s
#68 gpt-oss-120b medium OpenAI 10.0 5.8 1/1 31.2s
#5 Gemini 3 Flash Preview low Google 3.0 8.8 0/1 3.27s
#12 Gemini 3 PRO Preview medium Google 3.0 8.4 0/1 10.4s

Model teratas menurut Skor Gabungan

Skor Gabungan vs total biaya

Model teratas menurut Waktu respons (rata-rata)