Navigatie
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs xAI: Grok 4.3

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-01

Metriek Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Releasedatum: 2026-02-19 Grok 4.3 Grok 4.3 medium Releasedatum: 2026-05-01
Score 9.6 8.2
Rang #2 #20
Betrouwbaarheid n.v.t. 10.0
Consistentie 10.0 8.6
Correcte tests
Slaagpercentage per poging 94.4% 81.5%
Instabiele tests 0 3
Totaal runs 54 54
Kosten per resultaat 3.400 3.974
Totale kosten $0.578 $0.517
Invoerprijs $2.000 / 1M $1.250 / 1M
Uitvoerprijs $12.000 / 1M $2.500 / 1M
Uitvoer-tokens 1,932 1,223
Redeneer-tokens 40,542 187,047
Responstijd (gem.) 15.96s 48.63s
Responstijd (max) 40.61s 216.69s
Responstijd (totaal) 175.52s 875.27s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
Grok 4.3 10.0 10.0 100.0% 0 8.83s 88 8,207
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
Grok 4.3 10.0 10.0 100.0% 0 45.72s 284 9,659
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
Grok 4.3 10.0 10.0 100.0% 0 63.99s 234 15,301
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
Grok 4.3 10.0 10.0 100.0% 0 18.97s 180 9,546
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Grok 4.3 5.3 7.2 44.4% 1 181.74s 14 111,300
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
Grok 4.3 5.4 2.5 66.7% 1 24.70s 70 5,020
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Grok 4.3 9.8 10.0 100.0% 0 18.58s 57 8,713
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
Grok 4.3 5.9 7.2 55.6% 1 22.53s 128 14,686
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
Grok 4.3 10.0 10.0 100.0% 0 17.66s 168 4,615

Snelle vergelijking

Vergelijkingspaar wisselen