#86

Owl Alpha

Openrouter Rilis: 2026-04-30 Diuji pada: 2026-04-30 17:24 openrouter/owl-alpha::none

(medium) (none)

Ringkasan

Owl Alpha mendapat skor 6.0 di AI BENCHY dan berada di peringkat #86. Model ini memiliki reliabilitas 10.0, tingkat keberhasilan 46.3%, total biaya $0.000, dan waktu respons rata-rata 7.07s.

Yang membuat Owl Alpha unik: Model ini paling menonjol di Pemrograman, dengan peringkat #1, sementara Trik anti-AI adalah area terlemahnya di #17. Total biaya benchmark-nya sangat rendah untuk kisaran skornya.

Model diarsipkan: model ini tidak lagi diperbarui atau diuji pada pengujian baru.

Skor

6.0

Konsistensi

9.1

Keandalan

10.0

Total biaya (harga saat ini)

$0.000

Total token output

1,671

Total token input

Harga input

$0.000 / 1M

Harga output

$0.000 / 1M

Tes benar

Tes Salah: 11

Tingkat lulus per percobaan: 46.3%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

7.07s

Waktu respons (maks): 32.27s

Waktu respons (total): 127.23s

Jawaban salah: 7 Tidak mengikuti instruksi: 4

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#86 Owl Alpha

none

Provider returned error

Biaya: $0.000
Waktu: 0.2s
Token: 0 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-06-04 14:29 Tes baru ditambahkan	5.6	10.0	$0.000	Bandingkan
2026-05-22 00:42 Suite berubah	5.7	10.0	$0.000	Bandingkan
2026-04-30 17:24 Uji ulang	6.0	10.0	$0.000	Run saat ini
2026-04-30 15:31 Run awal	6.0	10.0	$0.000	Bandingkan

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	3.4	7.9
Pemrograman	10.0	10.0
Gabungan	3.0	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	5.3	10.0
Kecerdasan umum	4.3	10.0
Kepatuhan instruksi	6.4	10.0
Pemecahan teka-teki	5.9	7.2
Pemanggilan alat	10.0	10.0

Owl Alpha

Hamster playing table tennis

#86 Owl Alpha

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Model yang Dibandingkan