Navigatie
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.7 Plus vs Z.ai: GLM 5

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-06-03

Metriek Qwen3.7 Plus Qwen3.7 Plus medium Releasedatum: 2026-06-03 GLM 5 GLM 5 medium Releasedatum: 2026-02-12
Score 8.4 8.2
Rang #16 #18
Betrouwbaarheid 9.9 10.0
Consistentie 9.2 8.4
Correcte tests
Slaagpercentage per poging 80.0% 81.7%
Instabiele tests 2 4
Totaal runs 60 60
Kosten per resultaat 1.324 1.676
Totale kosten $0.199 $0.212
Invoerprijs $0.400 / 1M $0.600 / 1M
Uitvoerprijs $1.600 / 1M $1.920 / 1M
Totaal aantal invoer-tokens 38,104 32,626
Uitvoer-tokens 2,107 21,558
Redeneer-tokens 112,479 95,772
Responstijd (gem.) 36.84s 32.67s
Responstijd (max) 178.04s 99.85s
Responstijd (totaal) 736.86s 392.01s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.7 Plus 10.0 10.0 100.0% 0 8.58s 672 195 5,065
GLM 5 10.0 10.0 100.0% 0 23.66s 555 480 7,056
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.7 Plus 6.5 5.9 66.7% 1 122.40s 3,637 396 30,301
GLM 5 10.0 10.0 100.0% 0 89.47s 4,656 2,985 45,706
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.7 Plus 10.0 10.0 100.0% 0 65.24s 14,934 366 10,132
GLM 5 10.0 10.0 100.0% 0 28.96s 12,804 662 3,242
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.7 Plus 10.0 10.0 100.0% 0 21.75s 7,782 270 6,713
GLM 5 7.1 5.6 83.3% 1 8.90s 5,508 567 3,734
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.7 Plus 3.6 7.2 22.2% 1 45.35s 771 57 27,073
GLM 5 3.5 4.4 33.3% 2 0ms 260 13,176 14,137
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.7 Plus 10.0 10.0 100.0% 0 25.48s 516 123 3,998
GLM 5 6.1 3.1 66.7% 1 14.69s 477 2,020 2,248
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.7 Plus 10.0 10.0 100.0% 0 16.13s 699 102 5,013
GLM 5 10.0 10.0 100.0% 0 7.25s 636 1,001 2,129
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.7 Plus 10.0 10.0 100.0% 0 16.38s 696 280 7,312
GLM 5 10.0 10.0 100.0% 0 11.33s 609 33 4,076
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.7 Plus 10.0 10.0 100.0% 0 15.02s 8,193 292 1,831
GLM 5 10.0 10.0 100.0% 0 15.93s 6,935 233 994
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.7 Plus 3.0 10.0 0.0% 0 91.07s 204 26 15,041
GLM 5 3.0 10.0 0.0% 0 67.37s 186 401 12,450

Snelle vergelijking

Vergelijkingspaar wisselen