Navigatie
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs Grok 4.20 Multi Agent Beta

Samenvatting

Benchmarkvergelijking Gemini 3.5 Flash vs Grok 4.20 Multi Agent Beta: Gemini 3.5 Flash leidt in gemiddelde score met 9.4 vs 6.6. Gemini 3.5 Flash heeft lagere benchmarkkosten met $0.349 vs $5.599. Gemini 3.5 Flash is sneller met 3.27s vs 9.69s, met slagingspercentages van 90.5% vs 59.3%.

Aanbevolen model: Gemini 3.5 Flash - Het heeft hier de beste score (9.4) en kost ongeveer 16.1x minder dan Grok 4.20 Multi Agent Beta.

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-06-10

Metriek Gemini 3.5 Flash Gemini 3.5 Flash low Releasedatum: 2026-05-19 Grok 4.20 Multi Agent Beta Grok 4.20 Multi Agent Beta medium Releasedatum: 2026-03-12
Score 9.4 6.6
Rang #3 #85
Betrouwbaarheid 10.0 n.v.t.
Consistentie 10.0 7.9
Correcte tests
Slaagpercentage per poging 90.5% 59.3%
Instabiele tests 0 5
Totaal runs 63 52
Kosten per resultaat 1.834 62.923
Totale kosten $0.349 $5.599
Invoerprijs $1.500 / 1M $4.235 / 1M
Uitvoerprijs $9.000 / 1M $4.235 / 1M
Totaal aantal invoer-tokens 36,938 721,952
Uitvoer-tokens 2,033 294,668
Redeneer-tokens 30,519 305,374
Responstijd (gem.) 3.27s 9.69s
Responstijd (max) 9.05s 35.28s
Responstijd (totaal) 68.65s 155.07s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#3 Gemini 3.5 Flash

low
Cost
$0.068
Time
39.1s
Tokens
7,588 tok

#85 Grok 4.20 Multi Agent Beta

medium
Cost
$0.261
Time
123.4s
Tokens
199,344 tok

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 494 209 2,536
Grok 4.20 Multi Agent Beta 6.9 5.8 75.0% 2 3.46s 90,925 33,706 33,077
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 7.8 10.0 66.7% 0 6.71s 8,118 458 13,420
Grok 4.20 Multi Agent Beta 10.0 10.0 100.0% 0 27.11s 13,212 86 13,141
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.44s 12,873 351 3,050
Grok 4.20 Multi Agent Beta 3.0 10.0 0.0% 0 0ms 0 0 0
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.81s 7,548 279 1,164
Grok 4.20 Multi Agent Beta 10.0 10.0 100.0% 0 5.54s 97,232 25,306 25,051
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 7.7 10.0 66.7% 0 3.39s 633 12 4,538
Grok 4.20 Multi Agent Beta 2.9 7.2 11.1% 1 24.67s 328,253 164,609 163,647
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.27s 486 119 916
Grok 4.20 Multi Agent Beta 5.8 2.8 66.7% 1 6.40s 41,387 15,848 15,746
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 9.9 10.0 100.0% 0 1.86s 615 71 1,652
Grok 4.20 Multi Agent Beta 9.8 10.0 100.0% 0 3.52s 43,923 19,752 19,617
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.35s 558 288 2,150
Grok 4.20 Multi Agent Beta 6.7 7.9 55.6% 1 5.19s 107,020 35,361 35,095
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.27s 5,457 234 403
Grok 4.20 Multi Agent Beta 3.0 10.0 0.0% 0 0ms 0 0 0
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.88s 156 12 690
Grok 4.20 Multi Agent Beta - - - - - - - - -

Snelle vergelijking

Vergelijkingspaar wisselen