AI BENCHY
Your ad here

#34

Claude Opus 4.6

Anthropic · Releasedatum: 2026-02-05 · anthropic/claude-opus-4.6::medium

Score

7.5

Consistentie

9.0

Totale kosten

$1.317

Totaal aantal uitvoer-tokens

43,777

Invoerprijs

$5.000 / 1M

Uitvoerprijs

$25.000 / 1M

Correcte tests

Foute tests: 6

Slaagpercentage per poging: 68.6%

Instabiele tests

2

Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).

Responstijd (gem.)

20.87s

Responstijd (max): 83.40s

Responstijd (totaal): 208.73s

Grafieken

Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Snelle vergelijking

Categorie-uitsplitsing

Categorie Score Consistentie Correcte tests
Anti-AI-trucs 6.4 5.8
Gecombineerd 10.0 10.0
Gegevensparsering en extractie 10.0 10.0
Domeinspecifiek 3.0 10.0
Algemene intelligentie 10.0 10.0
Instructies opvolgen 10.0 10.0
Puzzeloplossing 7.7 10.0
Toolaanroepen 10.0 10.0

Vergeleken modellen