Navigatie
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.3-Codex vs Z.ai: GLM 5

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-22

Metriek GPT-5.3-Codex GPT-5.3-Codex medium Releasedatum: 2026-02-05 GLM 5 GLM 5 medium Releasedatum: 2026-02-12
Score 8.3 8.2
Rang #15 #18
Betrouwbaarheid 10.0 10.0
Consistentie 8.4 8.4
Correcte tests
Slaagpercentage per poging 81.7% 81.7%
Instabiele tests 4 4
Totaal runs 60 60
Kosten per resultaat 4.891 1.688
Totale kosten $0.685 $0.237
Invoerprijs $1.750 / 1M $0.600 / 1M
Uitvoerprijs $14.000 / 1M $1.920 / 1M
Uitvoer-tokens 2,332 23,219
Redeneer-tokens 42,616 96,679
Responstijd (gem.) 15.97s 33.39s
Responstijd (max) 100.93s 99.85s
Responstijd (totaal) 319.30s 400.62s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
GLM 5 10.0 10.0 100.0% 0 23.66s 480 7,056
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.3-Codex 10.0 10.0 100.0% 0 18.45s 514 7,266
GLM 5 10.0 10.0 100.0% 0 89.47s 2,985 45,706
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
GLM 5 10.0 10.0 100.0% 0 28.96s 662 3,242
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
GLM 5 7.1 5.6 83.3% 1 8.90s 567 3,734
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
GLM 5 3.5 4.4 33.3% 2 0ms 13,176 14,137
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
GLM 5 6.1 3.1 66.7% 1 14.69s 2,020 2,248
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
GLM 5 10.0 10.0 100.0% 0 7.25s 1,001 2,129
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
GLM 5 10.0 10.0 100.0% 0 15.64s 1,694 4,983
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492
GLM 5 10.0 10.0 100.0% 0 15.93s 233 994
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.3-Codex 2.8 1.6 33.3% 1 14.43s 30 1,701
GLM 5 3.0 10.0 0.0% 0 67.37s 401 12,450

Snelle vergelijking

Vergelijkingspaar wisselen