#201

Laguna M.1

Poolside Rilis: 2026-04-28 Diuji pada: 2026-05-08 15:31 poolside/laguna-m.1::medium

(medium) (none)

Ringkasan

Laguna M.1 mendapat skor 4.7 di AI BENCHY dan berada di peringkat #201. Model ini memiliki reliabilitas 10.0, tingkat keberhasilan 45.5%, total biaya $0.033, dan waktu respons rata-rata 14.73s.

Yang membuat Laguna M.1 unik: Model ini paling menonjol di Parsing dan ekstraksi data, dengan peringkat #1, sementara Pemrograman adalah area terlemahnya di #11.

Model diarsipkan: model ini tidak lagi diperbarui atau diuji pada pengujian baru.

Skor

4.7

Konsistensi

7.9

Keandalan

10.0

Total biaya (harga saat ini)

$0.033 ↕ New

Diuji pada: $0.000

Total token output

58,087

Total token input

44,969

Harga input

$0.200 / 1M

Harga output

$0.400 / 1M

Tes benar

Tes Salah: 10

Tingkat lulus per percobaan: 45.5%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

14.73s

Waktu respons (maks): 53.14s

Waktu respons (total): 220.93s

Kesalahan API: 4 Jawaban salah: 4 Tidak mengikuti instruksi: 1 Tidak ada jawaban: 1

Riwayat harga

Data harga historis untuk model ini dari OpenRouter.

Tanggal	Harga input	Harga output
2026-06-04 15:40	$0.000 / 1M	$0.000 / 1M
2026-06-29 01:00	$0.200 / 1M	$0.400 / 1M

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	6.5	10.0
Pemrograman	1.5	4.0
Gabungan	1.5	5.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	5.3	7.2
Kecerdasan umum	3.0	10.0
Kepatuhan instruksi	10.0	10.0
Pemecahan teka-teki	5.3	10.0
Pemanggilan alat	10.0	10.0
Pengetahuan umum	3.0	10.0

Laguna M.1

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Model yang Dibandingkan