Navigatie
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 vs Z.ai: GLM 5

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-01

Metriek GPT-5.4 GPT-5.4 medium Releasedatum: 2026-03-05 GLM 5 GLM 5 medium Releasedatum: 2026-02-12
Score 8.2 8.4
Rang #23 #18
Betrouwbaarheid n.v.t. n.v.t.
Consistentie 8.7 8.2
Correcte tests
Slaagpercentage per poging 79.6% 85.2%
Instabiele tests 3 4
Totaal runs 54 54
Kosten per resultaat 6.399 1.188
Totale kosten $0.832 $0.155
Invoerprijs $2.500 / 1M $0.600 / 1M
Uitvoerprijs $15.000 / 1M $2.080 / 1M
Uitvoer-tokens 2,169 20,163
Redeneer-tokens 48,732 58,337
Responstijd (gem.) 18.63s 23.34s
Responstijd (max) 100.41s 79.09s
Responstijd (totaal) 335.26s 233.40s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
GLM 5 10.0 10.0 100.0% 0 23.66s 480 7,056
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.4 10.0 10.0 100.0% 0 13.03s 389 2,045
GLM 5 10.0 10.0 100.0% 0 79.09s 330 19,814
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
GLM 5 10.0 10.0 100.0% 0 28.96s 662 3,242
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
GLM 5 7.1 5.6 83.3% 1 8.90s 567 3,734
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
GLM 5 3.5 4.4 33.3% 2 0ms 13,176 14,137
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
GLM 5 6.1 3.1 66.7% 1 14.69s 2,020 2,248
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
GLM 5 10.0 10.0 100.0% 0 7.25s 1,001 2,129
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
GLM 5 10.0 10.0 100.0% 0 15.64s 1,694 4,983
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
GLM 5 10.0 10.0 100.0% 0 15.93s 233 994

Snelle vergelijking

Vergelijkingspaar wisselen