#208

Laguna M.1

Poolside Veröffentlichung: 2026-04-28 Getestet am: 2026-05-08 15:31 poolside/laguna-m.1::medium

(medium) (none)

Zusammenfassung

Laguna M.1 erreicht 4.7 bei AI BENCHY und liegt auf #208. Das Modell hat 10.0 Zuverlässigkeit, 45.5% Erfolgsrate, $0.033 Gesamtkosten und 14.73s durchschnittliche Antwortzeit.

Was Laguna M.1 besonders macht: Am stärksten ist es in Datenanalyse und -extraktion, wo es #1 erreicht; am schwächsten ist Programmierung mit #11.

Archiviertes Modell: Dieses Modell wird nicht mehr aktualisiert und nicht mehr in neuen Tests getestet.

Punktzahl

4.7

Konsistenz

7.9

Zuverlässigkeit

10.0

Gesamtkosten (aktueller Preis)

$0.033 ↕ New

Getestet zu: $0.000

Gesamte Ausgabe-Token

58,087

Gesamte Eingabe-Token

44,969

Eingabepreis

$0.200 / 1M

Ausgabepreis

$0.400 / 1M

Korrekte Tests

Falsche Tests: 10

Erfolgsquote pro Versuch: 45.5%

Instabile Tests

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

14.73s

Antwortzeit (Maximum): 53.14s

Antwortzeit (Gesamt): 220.93s

API-Fehler: 4 Falsche Antwort: 4 Anweisungen nicht befolgt: 1 Keine Antwort: 1

Preisverlauf

Historische Preisdaten für dieses Modell von OpenRouter.

Datum	Eingabepreis	Ausgabepreis
2026-06-04 15:40	$0.000 / 1M	$0.000 / 1M
2026-06-29 01:00	$0.200 / 1M	$0.400 / 1M

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Kategorie	Punktzahl	Konsistenz
Anti-KI-Tricks	6.5	10.0
Programmierung	1.5	4.0
Kombiniert	1.5	5.0
Datenanalyse und -extraktion	10.0	10.0
Domänenspezifisch	5.3	7.2
Allgemeine Intelligenz	3.0	10.0
Befolgung von Anweisungen	10.0	10.0
Rätsellösen	5.3	10.0
Werkzeugaufrufe	10.0	10.0
Allgemeinwissen	3.0	10.0

Laguna M.1

Diagramme

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Verglichene Modelle