AI BENCHY
Advertise here
#67

Laguna XS 2.1

Poolside Releasedatum: 2026-07-02 Getest op: 2026-07-02 16:38 poolside/laguna-xs-2.1::medium
(medium) (none)

Samenvatting

Laguna XS 2.1 scoort 7.0 op AI BENCHY en staat op #67. Het model heeft 10.0 betrouwbaarheid, een slagingspercentage van 44.4%, $0.036 totale kosten en 30.08s gemiddelde responstijd.

Wat Laguna XS 2.1 uniek maakt: Het gebruikt ongewoon veel redeneertokens, wat tragere of duurdere runs kan verklaren.

Score

7.0

Consistentie

9.6

Totaal aantal uitvoer-tokens

294,438

Totaal aantal invoer-tokens

45,324

Invoerprijs

$0.060 / 1M

Uitvoerprijs

$0.120 / 1M

Correcte tests

Foute tests: 12

Slaagpercentage per poging: 44.4%

Instabiele tests

1

Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).

Responstijd (gem.)

30.08s

Responstijd (max): 155.23s

Responstijd (totaal): 631.77s

Generatie-showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#67 Laguna XS 2.1

medium
Kosten
$0.001
Tijd
30.6s
Tokens
4,678 tok

Prijsgeschiedenis

Historische prijsgegevens voor dit model van OpenRouter.

Datum Invoerprijs Uitvoerprijs
2026-07-02 17:22 $0.060 / 1M $0.120 / 1M

Grafieken

Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Snelle vergelijking

Categorie-uitsplitsing

Categorie Score Consistentie Correcte tests
Anti-AI-trucs 4.8 10.0
Programmeren 5.5 10.0
Gecombineerd 9.6 10.0
Gegevensparsering en extractie 10.0 10.0
Domeinspecifiek 2.9 7.2
Algemene intelligentie 5.0 10.0
Instructies opvolgen 9.8 10.0
Puzzeloplossing 5.3 10.0
Toolaanroepen 10.0 10.0
Algemene kennis 3.0 10.0

Vergeleken modellen