Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen3.6 Plus Preview vs Z.ai: GLM 4.7 Flash

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-04

Metriek Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Releasedatum: 2026-03-30 GLM 4.7 Flash GLM 4.7 Flash medium Releasedatum: 2026-01-19
Score 8.5 4.7
Rang #7 #84
Consistentie 10.0 6.6
Correcte tests
Slaagpercentage per poging 76.5% 39.2%
Instabiele tests 0 7
Totaal runs 49 51
Kosten per resultaat 0.000 1.046
Totale kosten $0.000 $0.042
Invoerprijs $0.000 / 1M $0.060 / 1M
Uitvoerprijs $0.000 / 1M $0.400 / 1M
Uitvoer-tokens 1,756 38,719
Redeneer-tokens 77,213 65,465
Responstijd (gem.) 13.94s 33.44s
Responstijd (max) 43.55s 174.55s
Responstijd (totaal) 237.01s 334.39s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 9.90s 207 7,557
GLM 4.7 Flash 4.7 5.9 41.7% 2 14.95s 1,122 6,110
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 34.95s 452 13,073
GLM 4.7 Flash 2.8 2.1 33.3% 1 65.57s 2,585 20,648
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 14.95s 270 10,706
GLM 4.7 Flash 6.3 10.0 50.0% 0 1.51s 584 2,755
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.6 Plus Preview 3.0 10.0 0.0% 0 22.08s 49 26,895
GLM 4.7 Flash 3.5 4.4 33.3% 2 174.55s 33,000 25,394
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.6 Plus Preview 5.1 10.0 0.0% 0 27.05s 111 5,232
GLM 4.7 Flash 3.6 9.7 0.0% 0 18.14s 18 2,138
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 7.54s 102 5,552
GLM 4.7 Flash 6.2 5.8 66.7% 1 2.97s 388 2,181
Puzzle Solving Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 6.11s 298 6,868
GLM 4.7 Flash 2.9 7.2 11.1% 1 12.90s 798 5,225
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 5.87s 267 1,330
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 224 1,014

Snelle vergelijking

Vergelijkingspaar wisselen