Navigatie
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Google: Gemini 3.1 Pro Preview

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-29

Metriek Claude Opus 4.6 Claude Opus 4.6 medium Releasedatum: 2026-02-05 Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Releasedatum: 2026-02-19
Score 7.6 9.6
Rang #49 #2
Betrouwbaarheid n.v.t. n.v.t.
Consistentie 9.1 10.0
Correcte tests
Slaagpercentage per poging 70.4% 94.4%
Instabiele tests 2 0
Totaal runs 54 54
Kosten per resultaat 12.047 3.400
Totale kosten $1.446 $0.578
Invoerprijs $5.000 / 1M $2.000 / 1M
Uitvoerprijs $25.000 / 1M $12.000 / 1M
Uitvoer-tokens 29,829 1,932
Redeneer-tokens 18,938 40,542
Responstijd (gem.) 21.08s 15.96s
Responstijd (max) 83.40s 40.61s
Responstijd (totaal) 231.84s 175.52s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982

Snelle vergelijking

Vergelijkingspaar wisselen