AI BENCHY
Bandingkan Grafik
โค๏ธ XCS
Your ad here

#39

LiquidAI: LFM2-24B-A2B

Liquid ยท liquid/lfm-2-24b-a2b::none

Buka pemilih perbandingan model

Skor Rata-rata

2.43

Biaya per hasil

0.045

Konsistensi

8.91

Total Biaya

$0.001

Tes benar

1/14

Tes dianggap lulus penuh hanya jika semua run-nya lulus.

Tes Salah

13

Tingkat lulus per percobaan: 16.7%

Tes tidak stabil

2

Waktu respons: rata-rata 851ms ยท total 11.07s ยท maks 2.88s

Jawaban salah: 8 Kesalahan API: 3 Tidak mengikuti instruksi: 2

Model teratas berdasarkan skor

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Rincian Kategori

Kategori Skor Rata-rata Konsistensi Tes benar
Anti-AI Tricks 1.00 9.82 0/3
Data parsing and extraction 1.00 10.00 0/2
Domain specific 4.00 7.21 1/3
Instructions following 3.00 10.00 0/2
Puzzle Solving 3.34 7.89 0/3
Tool Calling 1.00 10.00 0/1