Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs xAI: Grok 4.20

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-02

Metriek Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Releasedatum: 2026-03-03 Grok 4.20 Grok 4.20 medium Releasedatum: 2026-03-31
Score 8.0 7.1
Rang #20 #40
Consistentie 10.0 8.2
Correcte tests
Slaagpercentage per poging 70.6% 66.7%
Instabiele tests 0 4
Totaal runs 51 51
Kosten per resultaat 0.168 7.358
Totale kosten $0.021 $0.663
Invoerprijs $0.250 / 1M $2.000 / 1M
Uitvoerprijs $1.500 / 1M $6.000 / 1M
Uitvoer-tokens 1,617 1,494
Redeneer-tokens 7,686 97,078
Responstijd (gem.) 3.28s 9.50s
Responstijd (max) 11.91s 29.87s
Responstijd (totaal) 55.80s 161.54s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 462 1,638
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 225 762
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 291 696
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 18 1,212
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 69 384
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
Grok 4.20 7.3 5.9 83.3% 1 4.42s 40 5,474
Puzzle Solving Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.76s 243 1,248
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620

Snelle vergelijking

Vergelijkingspaar wisselen