#221

Laguna Xs.2

Poolside Rilis: 2026-04-28 Diuji pada: 2026-05-08 15:31 poolside/laguna-xs.2::none

(medium) (none)

Ringkasan

Laguna Xs.2 mendapat skor 3.8 di AI BENCHY dan berada di peringkat #221. Model ini memiliki reliabilitas 10.0, tingkat keberhasilan 22.7%, total biaya $0.004, dan waktu respons rata-rata 806ms.

Yang membuat Laguna Xs.2 unik: Total biaya benchmark-nya sangat rendah untuk kisaran skornya. Model ini terasa cepat dibandingkan model serupa.

Model diarsipkan: model ini tidak lagi diperbarui atau diuji pada pengujian baru.

Skor

3.8

Konsistensi

8.6

Keandalan

10.0

Total biaya (harga saat ini)

$0.004 ↕ New

Diuji pada: $0.000

Total token output

2,826

Total token input

33,675

Harga input

$0.100 / 1M

Harga output

$0.200 / 1M

Tes benar

Tes Salah: 14

Tingkat lulus per percobaan: 22.7%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

806ms

Waktu respons (maks): 2.01s

Waktu respons (total): 12.09s

Jawaban salah: 8 Kesalahan API: 4 Tidak mengikuti instruksi: 1 Pemanggilan alat tidak valid: 1

Riwayat harga

Data harga historis untuk model ini dari OpenRouter.

Tanggal	Harga input	Harga output
2026-06-04 15:40	$0.000 / 1M	$0.000 / 1M
2026-06-29 01:00	$0.100 / 1M	$0.200 / 1M

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	3.0	10.0
Pemrograman	8.3	3.3
Gabungan	1.5	5.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	5.3	10.0
Kecerdasan umum	3.0	10.0
Kepatuhan instruksi	6.5	10.0
Pemecahan teka-teki	5.3	10.0
Pemanggilan alat	3.0	10.0
Pengetahuan umum	3.0	10.0

Laguna Xs.2

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Model yang Dibandingkan