Anthropic: Claude Opus 4.7 vs Google: Gemini 3.1 Pro Preview
Samenvatting
Benchmarkvergelijking Claude Opus 4.7 vs Gemini 3.1 Pro Preview: Gemini 3.1 Pro Preview leidt in gemiddelde score met 9.2 vs 7.4. Claude Opus 4.7 heeft lagere benchmarkkosten met $0.505 vs $1.054. Claude Opus 4.7 is sneller met 3.02s vs 20.14s, met slagingspercentages van 76.2% vs 90.5%.
Aanbevolen model: Claude Opus 4.7 - Het biedt de beste totale afweging: concurrerende score (7.4), lagere kosten dan Gemini 3.1 Pro Preview en evenwichtige responstijd.
Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-06-18
Metriek
Claude Opus 4.7Claude Opus 4.7noneGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.Releasedatum: 2026-04-16
10.0Succescore bij de eerste poging: 10.0 betekent geen herhaalbare doel-API- of snelheidslimietfouten vóór succesvolle calls; geregistreerde fouten verlagen de score.…
10.0Succescore bij de eerste poging: 10.0 betekent geen herhaalbare doel-API- of snelheidslimietfouten vóór succesvolle calls; geregistreerde fouten verlagen de score.…
Consistentie
9.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
Correcte tests
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 3Responstijd (gem.)3.02sResponstijd (max)18.27sResponstijd (totaal)57.44sEen test is alleen volledig geslaagd als alle runs slagen.…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)20.14sResponstijd (max)88.68sResponstijd (totaal)281.92sEen test is alleen volledig geslaagd als alle runs slagen.…
Slaagpercentage per poging
76.2%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
90.5%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
Instabiele tests
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Totaal runs
57Totaal runs…
63Totaal runs…
Kosten per resultaat
3.154Toont de gemiddelde kosten per correct benchmark-antwoord in centen (lager is beter).…
5.546Toont de gemiddelde kosten per correct benchmark-antwoord in centen (lager is beter).…
Totale kosten
$0.505Totale kosten (huidige prijs)…
$1.054Totale kosten (huidige prijs)…
Invoerprijs
$5.000 / 1MInvoerprijs…
$2.000 / 1MInvoerprijs…
Uitvoerprijs
$25.000 / 1MUitvoerprijs…
$12.000 / 1MUitvoerprijs…
Totaal aantal invoer-tokens
69,576Totaal aantal invoer-tokens…
41,617Totaal aantal invoer-tokens…
Uitvoer-tokens
6,265Uitvoer-tokens…
1,977Uitvoer-tokens…
Redeneer-tokens
0Redeneer-tokens…
78,896Redeneer-tokens…
Responstijd (gem.)
3.02sResponstijd (gem.)…
20.14sResponstijd (gem.)…
Responstijd (max)
18.27sResponstijd (max)…
88.68sResponstijd (max)…
Responstijd (totaal)
57.44sResponstijd (totaal)…
281.92sResponstijd (totaal)…
Generatie-showcase
Hamster playing table tennis
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
#49 Claude Opus 4.7
none
Kosten
$0.051
Tijd
24.2s
Tokens
2,181 tok
#7 Gemini 3.1 Pro Preview
medium
Kosten
$0.115
Tijd
87.2s
Tokens
9,629 tok
Score
-
Kosten
-
Tijd
-
Tokens
-
Topmodellen op score
Score vs totale kosten
Responstijd (gem.)
Score vs Responstijd (gem.)
Totaal aantal uitvoer-tokens
Score vs Totaal aantal uitvoer-tokens
Categorie-uitsplitsing
Anti-AI-trucs
Score
Consistentie
Slaagpercentage per poging
Instabiele tests
Correcte tests
Responstijd (gem.)
Invoer-tokens
Uitvoer-tokens
Redeneer-tokens
Claude Opus 4.7Gearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
8.3Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
75.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)2.12sResponstijd (max)3.75sResponstijd (totaal)8.50sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.90sResponstijd (max)9.52sResponstijd (totaal)15.80sEen test is alleen volledig geslaagd als alle runs slagen.…
7.90sResponstijd (gem.)…
498Totaal aantal invoer-tokens…
112Uitvoer-tokens…
3,218Redeneer-tokens…
Programmeren
Score
Consistentie
Slaagpercentage per poging
Instabiele tests
Correcte tests
Responstijd (gem.)
Invoer-tokens
Uitvoer-tokens
Redeneer-tokens
Claude Opus 4.7Gearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
3.3Gemiddelde score over alle benchmarktests.…
3.3Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
33.3%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.84sResponstijd (max)2.84sResponstijd (totaal)2.84sEen test is alleen volledig geslaagd als alle runs slagen.…
9.9Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
66.7%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)40.17sResponstijd (max)88.68sResponstijd (totaal)120.52sEen test is alleen volledig geslaagd als alle runs slagen.…
40.17sResponstijd (gem.)…
8,124Totaal aantal invoer-tokens…
435Uitvoer-tokens…
41,247Redeneer-tokens…
Gecombineerd
Score
Consistentie
Slaagpercentage per poging
Instabiele tests
Correcte tests
Responstijd (gem.)
Invoer-tokens
Uitvoer-tokens
Redeneer-tokens
Claude Opus 4.7Gearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
9.5Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)18.27sResponstijd (max)18.27sResponstijd (totaal)18.27sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)40.61sResponstijd (max)40.61sResponstijd (totaal)40.61sEen test is alleen volledig geslaagd als alle runs slagen.…
40.61sResponstijd (gem.)…
17,240Totaal aantal invoer-tokens…
432Uitvoer-tokens…
9,281Redeneer-tokens…
Gegevensparsering en extractie
Score
Consistentie
Slaagpercentage per poging
Instabiele tests
Correcte tests
Responstijd (gem.)
Invoer-tokens
Uitvoer-tokens
Redeneer-tokens
Claude Opus 4.7Gearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
10.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.15sResponstijd (max)2.33sResponstijd (totaal)4.29sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.72sResponstijd (max)7.72sResponstijd (totaal)7.72sEen test is alleen volledig geslaagd als alle runs slagen.…
7.72sResponstijd (gem.)…
7,265Totaal aantal invoer-tokens…
279Uitvoer-tokens…
3,904Redeneer-tokens…
Domeinspecifiek
Score
Consistentie
Slaagpercentage per poging
Instabiele tests
Correcte tests
Responstijd (gem.)
Invoer-tokens
Uitvoer-tokens
Redeneer-tokens
Claude Opus 4.7Gearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
7.7Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
66.7%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)1.19sResponstijd (max)1.40sResponstijd (totaal)3.58sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
66.7%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)32.73sResponstijd (max)32.73sResponstijd (totaal)32.73sEen test is alleen volledig geslaagd als alle runs slagen.…
32.73sResponstijd (gem.)…
635Totaal aantal invoer-tokens…
18Uitvoer-tokens…
12,424Redeneer-tokens…
Algemene intelligentie
Score
Consistentie
Slaagpercentage per poging
Instabiele tests
Correcte tests
Responstijd (gem.)
Invoer-tokens
Uitvoer-tokens
Redeneer-tokens
Claude Opus 4.7Gearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
10.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.47sResponstijd (max)3.47sResponstijd (totaal)3.47sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)11.77sResponstijd (max)11.77sResponstijd (totaal)11.77sEen test is alleen volledig geslaagd als alle runs slagen.…
11.77sResponstijd (gem.)…
490Totaal aantal invoer-tokens…
108Uitvoer-tokens…
1,179Redeneer-tokens…
Instructies opvolgen
Score
Consistentie
Slaagpercentage per poging
Instabiele tests
Correcte tests
Responstijd (gem.)
Invoer-tokens
Uitvoer-tokens
Redeneer-tokens
Claude Opus 4.7Gearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
10.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)1.46sResponstijd (max)1.68sResponstijd (totaal)2.91sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.56sResponstijd (max)9.56sResponstijd (totaal)9.56sEen test is alleen volledig geslaagd als alle runs slagen.…
9.56sResponstijd (gem.)…
621Totaal aantal invoer-tokens…
72Uitvoer-tokens…
2,236Redeneer-tokens…
Puzzeloplossing
Score
Consistentie
Slaagpercentage per poging
Instabiele tests
Correcte tests
Responstijd (gem.)
Invoer-tokens
Uitvoer-tokens
Redeneer-tokens
Claude Opus 4.7Gearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
10.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.46sResponstijd (max)3.72sResponstijd (totaal)7.38sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)6.90sResponstijd (max)8.49sResponstijd (totaal)13.79sEen test is alleen volledig geslaagd als alle runs slagen.…
6.90sResponstijd (gem.)…
570Totaal aantal invoer-tokens…
235Uitvoer-tokens…
3,128Redeneer-tokens…
Toolaanroepen
Score
Consistentie
Slaagpercentage per poging
Instabiele tests
Correcte tests
Responstijd (gem.)
Invoer-tokens
Uitvoer-tokens
Redeneer-tokens
Claude Opus 4.7Gearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
10.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.74sResponstijd (max)4.74sResponstijd (totaal)4.74sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)23.15sResponstijd (max)23.15sResponstijd (totaal)23.15sEen test is alleen volledig geslaagd als alle runs slagen.…
23.15sResponstijd (gem.)…
6,018Totaal aantal invoer-tokens…
274Uitvoer-tokens…
982Redeneer-tokens…
Algemene kennis
Score
Consistentie
Slaagpercentage per poging
Instabiele tests
Correcte tests
Responstijd (gem.)
Invoer-tokens
Uitvoer-tokens
Redeneer-tokens
Claude Opus 4.7Gearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
3.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
0.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)1.46sResponstijd (max)1.46sResponstijd (totaal)1.46sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)6.27sResponstijd (max)6.27sResponstijd (totaal)6.27sEen test is alleen volledig geslaagd als alle runs slagen.…