#107

LFM2-24B-A2B

Liquid Veröffentlichung: 2026-02-24 Getestet am: 2026-04-10 23:27 liquid/lfm-2-24b-a2b::none

Zusammenfassung

LFM2-24B-A2B erreicht 4.1 bei AI BENCHY und liegt auf #107. Das Modell hat k. A. Zuverlässigkeit, 14.6% Erfolgsrate, $0.001 Gesamtkosten und 811ms durchschnittliche Antwortzeit.

Was LFM2-24B-A2B besonders macht: Am stärksten ist es in Domänenspezifisch, wo es #4 erreicht; am schwächsten ist Datenanalyse und -extraktion mit #15. Es ist im Vergleich zu ähnlichen Modellen auffällig schnell.

Archiviertes Modell: Dieses Modell wird nicht mehr aktualisiert und nicht mehr in neuen Tests getestet.

Punktzahl

4.1

Konsistenz

9.0

Zuverlässigkeit

k. A.

Gesamtkosten (aktueller Preis)

$0.001

Gesamte Ausgabe-Token

1,185

Gesamte Eingabe-Token

Eingabepreis

$0.030 / 1M

Ausgabepreis

$0.120 / 1M

Korrekte Tests

Falsche Tests: 15

Erfolgsquote pro Versuch: 14.6%

Instabile Tests

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

811ms

Antwortzeit (Maximum): 2.88s

Antwortzeit (Gesamt): 11.35s

Falsche Antwort: 9 API-Fehler: 4 Anweisungen nicht befolgt: 2

Generierungs-Showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#107 LiquidAI: LFM2-24B-A2B

none

Ungültiges SVG

Kosten: $0.000
Zeit: 300.0s
Token: 0 tok

Testverlauf

Getestet am	Punktzahl	Zuverlässigkeit	Gesamtkosten	Vergleichen
2026-05-06 14:04 Erneuter Test	4.2	k. A.	$0.001	Vergleichen
2026-05-06 14:04 Erneuter Test	4.2	k. A.	$0.001	Vergleichen
2026-05-06 14:04 Suite geändert	4.2	k. A.	$0.001	Vergleichen
2026-04-10 23:27 Erster erfasster Lauf	4.1	k. A.	$0.001	Aktueller Lauf

Laufvergleich

Lauf	Punktzahl	Konsistenz	Zuverlässigkeit	Korrekte Tests	Instabile Tests	Gesamte Ausgabe-Token	Gesamtkosten	Antwortzeit (Durchschnitt)
2026-04-10 23:27 · Erster erfasster Lauf	4.1	9.0	k. A.	1/16	2	1,185	$0.001	811ms
2026-05-06 14:04 · Erneuter Test	4.2	9.0	k. A.	2/16	2	1,185	$0.001	811ms
Differenz	-0.1	0.0		-1	0	0	$0.000	0ms

Diese beiden Läufe nutzten unterschiedliche Benchmark-Suiten, daher spiegeln die Deltas sowohl Modell- als auch Suite-Änderungen wider.

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

LFM2-24B-A2BnonevsGemini 3.5 Flashhigh LFM2-24B-A2BnonevsGemini 3 Flash Previewmedium LFM2-24B-A2BnonevsNemotron 3 Ultra 550b A55bmediumKostenlos verfügbar LFM2-24B-A2BnonevsGPT-5.5low

Kategorieaufschlüsselung

Kategorie	Punktzahl	Konsistenz
Anti-KI-Tricks	3.3	9.8
Kombiniert	3.0	10.0
Datenanalyse und -extraktion	3.0	10.0
Domänenspezifisch	5.9	7.2
Allgemeine Intelligenz	4.0	10.0
Befolgung von Anweisungen	4.8	10.0
Rätsellösen	4.4	7.9
Werkzeugaufrufe	3.0	10.0

LFM2-24B-A2B

Hamster playing table tennis

#107 LiquidAI: LFM2-24B-A2B

Diagramme

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Kategorieaufschlüsselung

Verglichene Modelle