AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#25

Claude Sonnet 4.6

Anthropic · Releasedatum: 2026-02-17 · anthropic/claude-sonnet-4.6::medium

Score

7.9

Consistentie

9.5

Totale kosten

$1.024

Totaal aantal uitvoer-tokens

59,861

Invoerprijs

$3.000 / 1M

Uitvoerprijs

$15.000 / 1M

Correcte tests

Foute tests: 5

Slaagpercentage per poging: 72.6%

Instabiele tests

1

Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).

Responstijd (gem.)

10.09s

Responstijd (max): 46.35s

Responstijd (totaal): 90.85s

Grafieken

Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Snelle vergelijking

Categorie-uitsplitsing

Categorie Score Consistentie Correcte tests
Anti-AI-trucs 6.5 10.0
Gecombineerd 10.0 10.0
Gegevensparsering en extractie 10.0 10.0
Domeinspecifiek 2.9 7.2
Algemene intelligentie 10.0 10.0
Instructies opvolgen 10.0 10.0
Puzzeloplossing 10.0 10.0
Toolaanroepen 10.0 10.0

Vergeleken modellen