AI BENCHY
AD
Track all your projects in one dashboard. Get ๐Ÿ“Šstats, ๐Ÿ”ฅheatmaps and ๐Ÿ‘€recordings in one self-hosted dashboard.
uxwizz.com

#35

Hunter Alpha

Openrouter ยท Rilis: Tanggal rilis tidak diketahui ยท openrouter/hunter-alpha::medium

Skor Rata-rata

5.9

Biaya per hasil

0.000

Konsistensi

7.6

Total Biaya

$0.000

Tes benar

Tes Salah: 8

Tingkat lulus per percobaan: 68.8%

Tes tidak stabil

5

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

10.71s

Waktu respons (maks): 30.53s

Waktu respons (total): 171.41s

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Total token output

Perbandingan Cepat

Rincian Kategori

Kategori Skor Rata-rata Konsistensi Tes benar
Trik anti-AI 7.0 7.2
Gabungan 10.0 1.6
Parsing dan ekstraksi data 9.9 10.0
Spesifik domain 10.0 10.0
Kecerdasan umum 8.0 3.7
Kepatuhan instruksi 9.5 10.0
Pemecahan teka-teki 4.3 4.7
Pemanggilan alat 10.0 10.0

Model yang Dibandingkan