#128

Laguna XS 2.1

Poolside Rilis: 2026-07-02 Diuji pada: 2026-07-02 16:44 poolside/laguna-xs-2.1::none

(medium) (none)

Ringkasan

Laguna XS 2.1 mendapat skor 5.3 di AI BENCHY dan berada di peringkat #128. Model ini memiliki reliabilitas 10.0, tingkat keberhasilan 31.8%, total biaya $0.003, dan waktu respons rata-rata 722ms.

Yang membuat Laguna XS 2.1 unik: Model ini paling menonjol di Trik anti-AI, dengan peringkat #3, sementara Kepatuhan instruksi adalah area terlemahnya di #15. Total biaya benchmark-nya sangat rendah untuk kisaran skornya. Model ini terasa cepat dibandingkan model serupa.

Skor

5.3

Konsistensi

9.0

Keandalan

10.0

Total biaya (harga saat ini)

$0.003

Total token output

3,451

Total token input

41,148

Harga input

$0.060 / 1M

Harga output

$0.120 / 1M

Tes benar

Tes Salah: 16

Tingkat lulus per percobaan: 31.8%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

722ms

Waktu respons (maks): 2.30s

Waktu respons (total): 15.17s

Jawaban salah: 14 Tidak mengikuti instruksi: 1 Kedaluwarsa: 1

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#128 Laguna XS 2.1

none

Biaya: $0.001
Waktu: 27.6s
Token: 4,344 tok

Riwayat harga

Data harga historis untuk model ini dari OpenRouter.

Tanggal	Harga input	Harga output
2026-07-02 17:22	$0.060 / 1M	$0.120 / 1M

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	5.3	8.3
Pemrograman	4.3	7.8
Gabungan	3.0	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	5.3	10.0
Kecerdasan umum	5.0	10.0
Kepatuhan instruksi	3.8	5.8
Pemecahan teka-teki	3.0	10.0
Pemanggilan alat	10.0	10.0
Pengetahuan umum	3.0	10.0

Laguna XS 2.1

Hamster playing table tennis

#128 Laguna XS 2.1

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan