#81
Poolside
Rilis: 2026-04-28
Diuji pada: 2026-04-28 23:03
poolside/laguna-xs.2::medium
(medium)
(none)
Harga input
$0.000 / 1M
Harga output
$0.000 / 1M
Tes tidak stabil
7
Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).
Grafik
Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.
Skor vs Total Biaya
Waktu respons (rata-rata)
Skor vs Waktu respons (rata-rata)
Total token output
Skor vs Total token output
Perbandingan Cepat
Laguna Xs.2mediumTersedia gratisvsGLM 5V TurbononeLaguna Xs.2mediumTersedia gratisvsGemma 4 26B A4BnoneTersedia gratisLaguna Xs.2mediumTersedia gratisvsGPT-5 NanomediumLaguna Xs.2mediumTersedia gratisvsSeed-2.0-LitenoneLaguna Xs.2mediumTersedia gratisvsLaguna M.1mediumTersedia gratisLaguna Xs.2mediumTersedia gratisvsGemini 2.5 FlashnoneLaguna Xs.2mediumTersedia gratisvsGemini 3 Flash PreviewmediumLaguna Xs.2mediumTersedia gratisvsGemini 3.1 Pro PreviewmediumLaguna Xs.2mediumTersedia gratisvsHY3 PreviewhighTersedia gratis
Rincian Kategori
| Kategori | Skor | Konsistensi | Tes benar |
|---|---|---|---|
| Trik anti-AI | 7.4 | 5.9 | |
| Pemrograman | 6.3 | 3.7 | |
| Gabungan | 3.0 | 10.0 | |
| Parsing dan ekstraksi data | 7.1 | 5.6 | |
| Spesifik domain | 4.1 | 4.4 | |
| Kecerdasan umum | 4.1 | 10.0 | |
| Kepatuhan instruksi | 10.0 | 10.0 | |
| Pemecahan teka-teki | 5.3 | 10.0 | |
| Pemanggilan alat | 4.7 | 1.6 |