Navigatie
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs Z.ai: GLM 5.1

Samenvatting

Benchmarkvergelijking Claude Sonnet 4.6 vs GLM 5.1: Claude Sonnet 4.6 leidt in gemiddelde score met 7.3 vs 7.1. GLM 5.1 heeft lagere benchmarkkosten met $0.292 vs $0.316. Claude Sonnet 4.6 is sneller met 5.04s vs 33.67s, met slagingspercentages van 55.6% vs 68.3%.

Aanbevolen model: Claude Sonnet 4.6 - Het heeft hier de beste score (7.3) en reageert ongeveer 6.7x sneller dan GLM 5.1.

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-06-12

Metriek Claude Sonnet 4.6 Claude Sonnet 4.6 none Releasedatum: 2026-02-17 GLM 5.1 GLM 5.1 medium Releasedatum: 2026-04-07
Score 7.3 7.1
Rang #56 #64
Betrouwbaarheid 10.0 6.7
Consistentie 9.7 8.3
Correcte tests
Slaagpercentage per poging 55.6% 68.3%
Instabiele tests 1 4
Totaal runs 63 63
Kosten per resultaat 2.870 2.496
Totale kosten $0.316 $0.292
Invoerprijs $3.000 / 1M $0.980 / 1M
Uitvoerprijs $15.000 / 1M $3.080 / 1M
Totaal aantal invoer-tokens 57,886 32,995
Uitvoer-tokens 9,465 11,655
Redeneer-tokens 0 75,421
Responstijd (gem.) 5.04s 33.67s
Responstijd (max) 23.84s 172.60s
Responstijd (totaal) 70.60s 673.41s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#56 Claude Sonnet 4.6

none
Cost
$0.038
Time
27.3s
Tokens
2,598 tok

#64 GLM 5.1

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
GLM 5.1 10.0 10.0 100.0% 0 8.31s 555 401 5,122
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
GLM 5.1 4.6 3.7 44.5% 2 109.63s 5,702 4,871 37,826
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
GLM 5.1 9.5 10.0 100.0% 0 43.11s 17,298 327 4,206
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
GLM 5.1 10.0 10.0 100.0% 0 9.33s 7,107 991 4,552
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
GLM 5.1 5.3 10.0 33.3% 0 29.77s 489 969 11,314
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
GLM 5.1 10.0 10.0 100.0% 0 20.95s 477 2,875 2,875
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
GLM 5.1 6.4 5.8 66.7% 1 7.47s 634 204 1,617
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
GLM 5.1 8.2 7.2 88.9% 1 31.64s 609 935 5,730
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
GLM 5.1 3.0 10.0 0.0% 0 0ms 0 0 0
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
GLM 5.1 3.0 10.0 0.0% 0 29.40s 124 82 2,179

Snelle vergelijking

Vergelijkingspaar wisselen