Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Ring 2.6 1t vs Z.ai: GLM 5.1

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-10

Metriek Ring 2.6 1t Ring 2.6 1t medium Releasedatum: 2026-05-10 Gratis beschikbaar GLM 5.1 GLM 5.1 medium Releasedatum: 2026-04-07
Score 7.2 7.6
Rang #55 #47
Betrouwbaarheid 9.9 0.0
Consistentie 8.7 8.7
Correcte tests
Slaagpercentage per poging 66.7% 71.9%
Instabiele tests 3 3
Totaal runs 57 57
Kosten per resultaat 0.000 1.741
Totale kosten $0.000 $0.209
Invoerprijs $0.000 / 1M $1.050 / 1M
Uitvoerprijs $0.000 / 1M $3.500 / 1M
Uitvoer-tokens 21,752 8,087
Redeneer-tokens 42,754 51,269
Responstijd (gem.) 61.29s 24.43s
Responstijd (max) 304.19s 118.52s
Responstijd (totaal) 1164.50s 439.65s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring 2.6 1t 10.0 10.0 100.0% 0 42.21s 3,833 4,891
GLM 5.1 10.0 10.0 100.0% 0 8.31s 401 5,122
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring 2.6 1t 10.0 10.0 100.0% 0 59.65s 1,369 3,985
GLM 5.1 4.7 1.6 66.7% 1 118.52s 1,339 13,777
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring 2.6 1t 10.0 10.0 100.0% 0 304.19s 324 6,088
GLM 5.1 9.5 10.0 100.0% 0 43.11s 327 4,206
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring 2.6 1t 6.5 10.0 50.0% 0 37.36s 840 1,937
GLM 5.1 10.0 10.0 100.0% 0 9.33s 991 4,552
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring 2.6 1t 3.5 4.4 33.3% 2 64.92s 9,744 15,013
GLM 5.1 5.3 10.0 33.3% 0 29.77s 969 11,314
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring 2.6 1t 4.1 10.0 0.0% 0 58.26s 150 583
GLM 5.1 10.0 10.0 100.0% 0 20.95s 2,875 2,875
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring 2.6 1t 9.8 10.0 100.0% 0 11.78s 266 1,831
GLM 5.1 6.4 5.8 66.7% 1 7.47s 204 1,617
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring 2.6 1t 5.9 7.2 55.6% 1 20.73s 697 2,479
GLM 5.1 8.2 7.2 88.9% 1 23.85s 899 5,627
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring 2.6 1t 10.0 10.0 100.0% 0 104.44s 234 1,531
GLM 5.1 3.0 10.0 0.0% 0 0ms 0 0
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring 2.6 1t 3.0 10.0 0.0% 0 113.91s 4,295 4,416
GLM 5.1 3.0 10.0 0.0% 0 29.40s 82 2,179

Snelle vergelijking

Vergelijkingspaar wisselen