#5 Gemini 3.5 Flash
medium- Kosten
- $0.201
- Tijd
- 112.9s
- Tokens
- 22,371 tok
Samenvatting
Gemini 3.5 Flash scoort 9.2 op AI BENCHY en staat op #5. Het model heeft 10.0 betrouwbaarheid, een slagingspercentage van 89.5%, $0.393 totale kosten en 3.90s gemiddelde responstijd.
Wat Gemini 3.5 Flash uniek maakt: Het is een van de hoogst gerangschikte modellen overall. De totale benchmarkkosten zijn ongewoon laag voor dit scoreniveau. Het is opvallend snel vergeleken met vergelijkbare modellen.
9.2
Consistentie
10.0
10.0
Totaal aantal uitvoer-tokens
38,630
Totaal aantal invoer-tokens
0
Invoerprijs
$1.500 / 1M
Uitvoerprijs
$9.000 / 1M
Instabiele tests
0
Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).
Generatie-showcase
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
Rungeschiedenis
| Getest op | Score | Betrouwbaarheid | Correcte tests | Totale kosten | Vergelijken |
|---|---|---|---|---|---|
| 2026-06-04 14:03 Nieuwe test toegevoegd | 9.0 | 10.0 | $0.582 | Vergelijken | |
| 2026-05-22 00:29 Hertest | 9.0 | 10.0 | $0.472 | Vergelijken | |
| 2026-05-19 23:35 Eerste run | 9.2 | 10.0 | $0.393 | Huidige run |
Runvergelijking
| Run | Score | Consistentie | Betrouwbaarheid | Correcte tests | Instabiele tests | Totaal aantal uitvoer-tokens | Totaal aantal invoer-tokens | Totale kosten | Responstijd (gem.) |
|---|---|---|---|---|---|---|---|---|---|
| 2026-05-19 23:35 · Eerste run | 9.2 | 10.0 | 10.0 | 17/19 | 0 | 38,630 | 0 | $0.393 | 3.90s |
| 2026-05-22 00:29 · Hertest | 9.0 | 9.6 | 10.0 | 17/20 | 1 | 46,787 | 0 | $0.472 | 4.29s |
| Verschil | +0.3 | +0.4 | 0.0 | 0 | -1 | -8157 | 0 | -$0.080 | -385ms |
Deze twee runs gebruikten verschillende benchmarksets, dus de verschillen weerspiegelen zowel modelveranderingen als suitewijzigingen.
Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.
| Categorie | Score | Consistentie | Correcte tests |
|---|---|---|---|
| Anti-AI-trucs | 10.0 | 10.0 | |
| Programmeren | 10.0 | 10.0 | |
| Gecombineerd | 10.0 | 10.0 | |
| Gegevensparsering en extractie | 10.0 | 10.0 | |
| Domeinspecifiek | 7.7 | 10.0 | |
| Algemene intelligentie | 10.0 | 10.0 | |
| Instructies opvolgen | 9.9 | 10.0 | |
| Puzzeloplossing | 7.7 | 10.0 | |
| Toolaanroepen | 10.0 | 10.0 | |
| Algemene kennis | 10.0 | 10.0 |