AI BENCHY
Advertise here

#150

LFM2-24B-A2B

Liquid Releasedatum: 2026-02-24 Getest op: 2026-05-06 14:04 liquid/lfm-2-24b-a2b::none

Gearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.

Score

4.2

Consistentie

9.0

Betrouwbaarheid

n.v.t.

Totaal aantal uitvoer-tokens

1,185

Invoerprijs

$0.030 / 1M

Uitvoerprijs

$0.120 / 1M

Correcte tests

Foute tests: 14

Slaagpercentage per poging: 18.8%

Instabiele tests

2

Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).

Responstijd (gem.)

811ms

Responstijd (max): 2.88s

Responstijd (totaal): 11.35s

Rungeschiedenis

Getest op Score Betrouwbaarheid Correcte tests Totale kosten Vergelijken
2026-05-06 14:04 Hertest 4.2 n.v.t. $0.001 Vergelijken
2026-05-06 14:04 Suite gewijzigd 4.2 n.v.t. $0.001 Huidige run
2026-04-10 23:27 Eerste geregistreerde run 4.1 n.v.t. $0.001 Vergelijken

Deze run gebruikte een andere benchmarkset. Houd rekening met suitewijzigingen bij het lezen van historische verschuivingen.

Runvergelijking

RunScoreConsistentieBetrouwbaarheidCorrecte testsInstabiele testsTotaal aantal uitvoer-tokensTotale kostenResponstijd (gem.)
2026-05-06 14:04 · Suite gewijzigd4.29.0n.v.t.2/1621,185$0.001811ms
2026-05-06 14:04 · Hertest4.29.0n.v.t.2/1621,185$0.001811ms
Verschil0.00.0000$0.0000ms

Grafieken

Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Snelle vergelijking

Categorie-uitsplitsing

Categorie Score Consistentie Correcte tests
Anti-AI-trucs 3.3 9.8
Gecombineerd 3.0 10.0
Gegevensparsering en extractie 3.0 10.0
Domeinspecifiek 5.9 7.2
Algemene intelligentie 4.0 10.0
Instructies opvolgen 6.3 10.0
Puzzeloplossing 3.7 7.7
Toolaanroepen 3.0 10.0

Vergeleken modellen