Kategori AI BENCHY
Peringkat Spesifik domain
Lihat model AI mana yang paling baik di Spesifik domain, mana yang tetap andal, dan di mana kesenjangan terbesar muncul.
Model yang ditampilkan
8
Rata-rata Skor Spesifik domain
4.8
Model terbaik
Gemini 3 Flash Preview 10.0| Peringkat | Model | Perusahaan | Skor Spesifik domain | Skor | Tes benar | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|
| #56 | Grok 4.20 Multi Agent Beta medium | X AI | 2.9 | 6.4 | 0/3 | 24.7s |
| #75 | GLM 5.1 none | Z.ai | 2.9 | 5.6 | 0/3 | 1.99s |
| #18 | GLM 5 Turbo medium | Z.ai | 2.9 | 8.1 | 0/3 | 71.1s |
| #24 | Gemma 4 26B A4B medium | 2.9 | 8.0 | 0/3 | 23.6s | |
| #51 | Nemotron 3 Super medium | NVIDIA | 2.9 | 6.7 | 0/3 | 16.2s |
| #68 | gpt-oss-120b medium | OpenAI | 2.9 | 5.8 | 0/3 | 50.9s |
| #71 | MiniMax M2.5 medium | Minimax | 2.9 | 5.7 | 0/3 | 237.3s |
| #96 | GPT-5.4 Nano none | OpenAI | 2.9 | 4.5 | 0/3 | 926ms |