Navigatie
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs Google: Gemma 4 31B

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-16

Metriek Claude Opus 4.7 Claude Opus 4.7 medium Releasedatum: 2026-04-16 Gemma 4 31B Gemma 4 31B medium Releasedatum: 2026-04-02 Gratis beschikbaar
Score 9.2 8.3
Rang #3 #14
Consistentie 10.0 9.2
Correcte tests
Slaagpercentage per poging 88.9% 79.6%
Instabiele tests 0 2
Totaal runs 54 54
Kosten per resultaat 2.790 0.136
Totale kosten $0.447 $0.018
Invoerprijs $5.000 / 1M $0.130 / 1M
Uitvoerprijs $25.000 / 1M $0.380 / 1M
Uitvoer-tokens 5,375 12,734
Redeneer-tokens 1,341 27,950
Responstijd (gem.) 3.53s 24.88s
Responstijd (max) 21.45s 70.97s
Responstijd (totaal) 60.03s 398.13s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 962 2,046
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 10.0 10.0 100.0% 0 6.41s 1,141 257
Gemma 4 31B 4.7 1.6 66.7% 1 70.97s 3,166 5,449
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 1,822 2,951
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 4,349 8,985
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 105 888
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 533 2,035
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 10.0 10.0 100.0% 0 2.51s 399 0
Gemma 4 31B 8.8 7.9 88.9% 1 27.63s 1,797 5,596
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0

Snelle vergelijking

Vergelijkingspaar wisselen