Kategori AI BENCHY
Peringkat Pengetahuan umum
Lihat model AI mana yang paling baik di Pengetahuan umum, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Metrik ↑.
169/169
Filter model
Tidak ada model yang cocok dengan pencarian dan filter saat ini.
| Peringkat | Model | Perusahaan | Skor Pengetahuan umum | Skor | Total Biaya | Tes benar | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|---|
| #5 | Gemini 3.5 Flash low | 10.0 | 9.2 | $0.349 | 1/1 | 1.88s | |
| #7 | Gemini 3.1 Pro Preview medium | 10.0 | 9.2 | $1.054 | 1/1 | 6.27s | |
| #8 | Gemini 3.5 Flash medium | 10.0 | 9.1 | $0.582 | 1/1 | 2.75s | |
| #52 | Gemini 3 Flash Preview low | 10.0 | 7.4 | $0.111 | 1/1 | 2.75s |