Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Google: Gemma 4 26B A4B

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-06-01

Metriek Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Releasedatum: 2026-03-03 Gemma 4 26B A4B Gemma 4 26B A4B medium Releasedatum: 2026-04-03 Gratis beschikbaar
Score 7.7 7.8
Rang #38 #33
Betrouwbaarheid 10.0 10.0
Consistentie 10.0 9.2
Correcte tests
Slaagpercentage per poging 65.0% 73.3%
Instabiele tests 0 2
Totaal runs 60 60
Kosten per resultaat 0.481 0.317
Totale kosten $0.063 $0.038
Invoerprijs $0.250 / 1M $0.060 / 1M
Uitvoerprijs $1.500 / 1M $0.330 / 1M
Uitvoer-tokens 2,204 28,000
Redeneer-tokens 33,657 82,045
Responstijd (gem.) 3.94s 50.92s
Responstijd (max) 14.93s 369.32s
Responstijd (totaal) 78.74s 967.47s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 9.1 10.0 75.0% 0 2.33s 570 4,305
Gemma 4 26B A4B 10.0 10.0 100.0% 0 6.20s 1,142 3,045
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 6.8 10.0 50.0% 0 3.98s 455 5,510
Gemma 4 26B A4B 2.9 10.0 0.0% 0 258.40s 14,838 26,122
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 14.93s 327 7,347
Gemma 4 26B A4B 9.6 10.0 100.0% 0 73.55s 5,415 13,112
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.29s 279 2,952
Gemma 4 26B A4B 10.0 10.0 100.0% 0 16.51s 1,567 2,827
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 4.21s 18 5,325
Gemma 4 26B A4B 2.9 4.4 22.2% 2 23.62s 2,469 7,105
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.16s 96 1,488
Gemma 4 26B A4B 10.0 10.0 100.0% 0 29.76s 25 5,075
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.91s 72 2,121
Gemma 4 26B A4B 10.0 10.0 100.0% 0 17.54s 887 4,470
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 7.7 10.0 66.7% 0 5.30s 141 1,896
Gemma 4 26B A4B 10.0 10.0 100.0% 0 5.79s 410 2,128
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.80s 234 912
Gemma 4 26B A4B 10.0 10.0 100.0% 0 9.01s 450 1,256
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 2.68s 12 1,801
Gemma 4 26B A4B 3.0 10.0 0.0% 0 180.87s 797 16,905

Snelle vergelijking

Vergelijkingspaar wisselen