Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.5 Flash vs Grok 4.20 Beta

Samenvatting

Benchmarkvergelijking Gemini 3.5 Flash vs Grok 4.20 Beta: Gemini 3.5 Flash leidt in gemiddelde score met 9.4 vs 5.8. Grok 4.20 Beta heeft lagere benchmarkkosten met $0.087 vs $0.349. Grok 4.20 Beta is sneller met 1.19s vs 3.27s, met slagingspercentages van 90.5% vs 37.0%.

Aanbevolen model: Gemini 3.5 Flash - Het heeft de sterkste score in deze vergelijking (9.4) en de beste balans tussen kosten en responstijd over alle 2 modellen.

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-06-10

Metriek Gemini 3.5 Flash Gemini 3.5 Flash low Releasedatum: 2026-05-19 Grok 4.20 Beta Grok 4.20 Beta none Releasedatum: 2026-03-12
Score 9.4 5.8
Rang #3 #107
Betrouwbaarheid 10.0 n.v.t.
Consistentie 10.0 9.6
Correcte tests
Slaagpercentage per poging 90.5% 37.0%
Instabiele tests 0 1
Totaal runs 63 52
Kosten per resultaat 1.834 1.510
Totale kosten $0.349 $0.087
Invoerprijs $1.500 / 1M $2.041 / 1M
Uitvoerprijs $9.000 / 1M $2.041 / 1M
Totaal aantal invoer-tokens 36,938 40,597
Uitvoer-tokens 2,033 1,657
Redeneer-tokens 30,519 0
Responstijd (gem.) 3.27s 1.19s
Responstijd (max) 9.05s 6.48s
Responstijd (totaal) 68.65s 21.43s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#3 Gemini 3.5 Flash

low
Cost
$0.068
Time
39.1s
Tokens
7,588 tok

#107 Grok 4.20 Beta

none
Invalid SVG
Cost
$0.004
Time
8.5s
Tokens
1,672 tok

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 494 209 2,536
Grok 4.20 Beta 4.0 8.4 16.7% 1 597ms 1,986 251 0
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 7.8 10.0 66.7% 0 6.71s 8,118 458 13,420
Grok 4.20 Beta 5.5 10.0 0.0% 0 1.14s 358 74 0
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.44s 12,873 351 3,050
Grok 4.20 Beta 3.0 10.0 0.0% 0 6.48s 17,673 282 0
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.81s 7,548 279 1,164
Grok 4.20 Beta 10.0 10.0 100.0% 0 601ms 7,749 197 0
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 7.7 10.0 66.7% 0 3.39s 633 12 4,538
Grok 4.20 Beta 3.0 10.0 0.0% 0 611ms 1,746 160 0
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.27s 486 119 916
Grok 4.20 Beta 5.0 10.0 0.0% 0 541ms 819 87 0
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 9.9 10.0 100.0% 0 1.86s 615 71 1,652
Grok 4.20 Beta 6.3 10.0 50.0% 0 649ms 1,350 60 0
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.35s 558 288 2,150
Grok 4.20 Beta 7.7 10.0 66.7% 0 586ms 1,671 357 0
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.27s 5,457 234 403
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.79s 7,245 189 0
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.88s 156 12 690
Grok 4.20 Beta - - - - - - - - -

Snelle vergelijking

Vergelijkingspaar wisselen