AI BENCHY
Your ad here

#50

Hunter Alpha

Openrouter ยท Rilis: Tanggal rilis tidak diketahui ยท openrouter/hunter-alpha::none

Skor Rata-rata

4.6

Biaya per hasil

0.000

Konsistensi

8.0

Total Biaya

$0.000

Tes benar

Tes Salah: 10

Tingkat lulus per percobaan: 52.1%

Tes tidak stabil

4

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

4.64s

Waktu respons (maks): 15.17s

Waktu respons (total): 74.24s

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Total token output

Perbandingan Cepat

Rincian Kategori

Kategori Skor Rata-rata Konsistensi Tes benar
Trik anti-AI 1.3 7.4
Gabungan 10.0 10.0
Parsing dan ekstraksi data 9.9 10.0
Spesifik domain 4.0 10.0
Kecerdasan umum 5.0 3.1
Kepatuhan instruksi 5.0 10.0
Pemecahan teka-teki 4.0 4.4
Pemanggilan alat 10.0 10.0

Model yang Dibandingkan