#67

Laguna XS 2.1

Poolside Rilis: 2026-07-02 Diuji pada: 2026-07-02 16:38 poolside/laguna-xs-2.1::medium

(medium) (none)

Ringkasan

Laguna XS 2.1 mendapat skor 7.0 di AI BENCHY dan berada di peringkat #67. Model ini memiliki reliabilitas 10.0, tingkat keberhasilan 44.4%, total biaya $0.036, dan waktu respons rata-rata 30.08s.

Yang membuat Laguna XS 2.1 unik: Model ini memakai token reasoning yang sangat tinggi, yang bisa menjelaskan run yang lebih lambat atau lebih mahal.

Skor

7.0

Konsistensi

9.6

Keandalan

10.0

Total biaya (harga saat ini)

$0.036

Total token output

294,438

Total token input

45,324

Harga input

$0.060 / 1M

Harga output

$0.120 / 1M

Tes benar

Tes Salah: 12

Tingkat lulus per percobaan: 44.4%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

30.08s

Waktu respons (maks): 155.23s

Waktu respons (total): 631.77s

Jawaban salah: 11 Tidak ada jawaban: 1

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#67 Laguna XS 2.1

medium

Biaya: $0.001
Waktu: 30.6s
Token: 4,678 tok

Riwayat harga

Data harga historis untuk model ini dari OpenRouter.

Tanggal	Harga input	Harga output
2026-07-02 17:22	$0.060 / 1M	$0.120 / 1M

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	4.8	10.0
Pemrograman	5.5	10.0
Gabungan	9.6	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	2.9	7.2
Kecerdasan umum	5.0	10.0
Kepatuhan instruksi	9.8	10.0
Pemecahan teka-teki	5.3	10.0
Pemanggilan alat	10.0	10.0
Pengetahuan umum	3.0	10.0

Laguna XS 2.1

Hamster playing table tennis

#67 Laguna XS 2.1

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan