#214

Laguna Xs.2

Poolside Veröffentlichung: 2026-04-28 Getestet am: 2026-05-08 15:31 poolside/laguna-xs.2::medium

(medium) (none)

Zusammenfassung

Laguna Xs.2 erreicht 4.1 bei AI BENCHY und liegt auf #214. Das Modell hat 10.0 Zuverlässigkeit, 43.9% Erfolgsrate, $0.015 Gesamtkosten und 6.73s durchschnittliche Antwortzeit.

Was Laguna Xs.2 besonders macht: Die Benchmark-Gesamtkosten sind für diese Leistungsklasse ungewöhnlich niedrig. Es ist im Vergleich zu ähnlichen Modellen auffällig schnell.

Archiviertes Modell: Dieses Modell wird nicht mehr aktualisiert und nicht mehr in neuen Tests getestet.

Punktzahl

4.1

Konsistenz

6.4

Zuverlässigkeit

10.0

Gesamtkosten (aktueller Preis)

$0.015 ↕ New

Getestet zu: $0.000

Gesamte Ausgabe-Token

54,218

Gesamte Eingabe-Token

39,481

Eingabepreis

$0.100 / 1M

Ausgabepreis

$0.200 / 1M

Korrekte Tests

Falsche Tests: 13

Erfolgsquote pro Versuch: 43.9%

Instabile Tests

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

6.73s

Antwortzeit (Maximum): 29.11s

Antwortzeit (Gesamt): 100.98s

Falsche Antwort: 6 API-Fehler: 4 Keine Antwort: 2 Ungültiger Werkzeugaufruf: 1

Preisverlauf

Historische Preisdaten für dieses Modell von OpenRouter.

Datum	Eingabepreis	Ausgabepreis
2026-06-04 15:40	$0.000 / 1M	$0.000 / 1M
2026-06-29 01:00	$0.100 / 1M	$0.200 / 1M

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Kategorie	Punktzahl	Konsistenz
Anti-KI-Tricks	6.9	7.9
Programmierung	2.1	1.2
Kombiniert	1.5	5.0
Datenanalyse und -extraktion	7.1	5.6
Domänenspezifisch	4.1	4.4
Allgemeine Intelligenz	3.0	10.0
Befolgung von Anweisungen	10.0	10.0
Rätsellösen	5.3	10.0
Werkzeugaufrufe	4.7	1.6
Allgemeinwissen	3.0	10.0

Laguna Xs.2

Diagramme

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Verglichene Modelle