AI BENCHY
Your ad here

Kegagalan kategori AI BENCHY

Gabungan: Kedaluwarsa

Gabungan
Kedaluwarsa

Lihat model AI mana yang paling mungkin mengalami Kedaluwarsa di Gabungan, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Tes benar ↑.

Model yang ditampilkan

2

Total kegagalan

2

Model yang paling terdampak

Hunter Alpha 1
Peringkat Model Perusahaan Jumlah Kedaluwarsa Skor kategori Tes benar Waktu respons (rata-rata)
#50 Hunter Alpha medium OpenRouter 1 4.7 0/1 30.5s
#97 Qwen3.5-9B medium Qwen 1 3.0 0/1 0ms

Model teratas menurut Jumlah Kedaluwarsa

Jumlah Kedaluwarsa vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang