Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5-35B-A3B vs Z.ai: GLM 5.1

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-29

Metriek Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Releasedatum: 2026-02-24 GLM 5.1 GLM 5.1 medium Releasedatum: 2026-04-07
Score 7.3 7.4
Rang #68 #56
Betrouwbaarheid 10.0 5.0
Consistentie 7.5 8.3
Correcte tests
Slaagpercentage per poging 73.3% 71.7%
Instabiele tests 6 4
Totaal runs 60 60
Kosten per resultaat 4.865 2.382
Totale kosten $0.536 $0.286
Invoerprijs $0.139 / 1M $0.980 / 1M
Uitvoerprijs $1.000 / 1M $3.080 / 1M
Uitvoer-tokens 31,242 11,511
Redeneer-tokens 330,546 71,979
Responstijd (gem.) 69.66s 33.45s
Responstijd (max) 409.98s 172.60s
Responstijd (totaal) 1393.17s 635.63s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.13s 798 42,652
GLM 5.1 10.0 10.0 100.0% 0 8.31s 401 5,122
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 6.5 10.0 50.0% 0 244.54s 14,456 88,431
GLM 5.1 4.7 1.6 66.7% 2 145.56s 4,727 34,384
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 4.7 1.6 66.7% 1 75.34s 775 12,485
GLM 5.1 9.5 10.0 100.0% 0 43.11s 327 4,206
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 7.3 5.9 83.3% 1 59.33s 235 19,493
GLM 5.1 10.0 10.0 100.0% 0 9.33s 991 4,552
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 4.1 4.4 44.5% 2 88.34s 41 46,368
GLM 5.1 5.3 10.0 33.3% 0 29.77s 969 11,314
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 2.8 1.6 33.3% 1 30.30s 20 3,753
GLM 5.1 10.0 10.0 100.0% 0 20.95s 2,875 2,875
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 97 17,361
GLM 5.1 6.4 5.8 66.7% 1 7.47s 204 1,617
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 8.2 7.2 88.9% 1 33.13s 3,592 26,585
GLM 5.1 8.2 7.2 88.9% 1 31.64s 935 5,730
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 309 1,365
GLM 5.1 3.0 10.0 0.0% 0 0ms 0 0
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 177.35s 10,919 72,053
GLM 5.1 3.0 10.0 0.0% 0 29.40s 82 2,179

Snelle vergelijking

Vergelijkingspaar wisselen