AI BENCHY
Your ad here

#11

Gemini 3.1 Flash Lite Preview

Google · Releasedatum: 2026-03-03 · google/gemini-3.1-flash-lite-preview::high

Gearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.

Score

8.4

Consistentie

9.6

Totale kosten

$2.310

Totaal aantal uitvoer-tokens

1,534,593

Invoerprijs

$0.250 / 1M

Uitvoerprijs

$1.500 / 1M

Correcte tests

Foute tests: 4

Slaagpercentage per poging: 77.1%

Instabiele tests

1

Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).

Responstijd (gem.)

68.83s

Responstijd (max): 280.52s

Responstijd (totaal): 1101.32s

Grafieken

Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Snelle vergelijking

Categorie-uitsplitsing

Categorie Score Consistentie Correcte tests
Anti-AI-trucs 10.0 10.0
Gecombineerd 10.0 10.0
Gegevensparsering en extractie 10.0 10.0
Domeinspecifiek 5.3 10.0
Algemene intelligentie 10.0 10.0
Instructies opvolgen 7.9 6.9
Puzzeloplossing 7.7 10.0
Toolaanroepen 10.0 10.0

Vergeleken modellen