Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

inclusionAI: Ring-2.6-1T vs Qwen: Qwen3.6 27B

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-22

Metriek Ring-2.6-1T Ring-2.6-1T medium Releasedatum: 2026-05-10 Qwen3.6 27B Qwen3.6 27B medium Releasedatum: 2026-04-20
Score 7.2 6.6
Rang #61 #83
Betrouwbaarheid 9.9 9.9
Consistentie 8.7 8.1
Correcte tests
Slaagpercentage per poging 66.7% 58.3%
Instabiele tests 3 5
Totaal runs 60 60
Kosten per resultaat 0.000 3.015
Totale kosten $0.000 $0.272
Invoerprijs $0.075 / 1M $0.317 / 1M
Uitvoerprijs $0.625 / 1M $3.200 / 1M
Uitvoer-tokens 21,752 13,007
Redeneer-tokens 42,754 105,697
Responstijd (gem.) 61.29s 57.65s
Responstijd (max) 304.19s 168.22s
Responstijd (totaal) 1164.50s 1153.04s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 42.21s 3,833 4,891
Qwen3.6 27B 8.3 10.0 75.0% 0 12.62s 582 4,311
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 59.65s 1,369 3,985
Qwen3.6 27B 6.6 10.0 50.0% 0 165.39s 4,760 26,668
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 304.19s 324 6,088
Qwen3.6 27B 7.0 3.7 66.7% 1 83.07s 2,088 14,689
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 6.5 10.0 50.0% 0 37.36s 840 1,937
Qwen3.6 27B 3.5 1.4 50.0% 2 37.30s 568 9,404
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 3.5 4.4 33.3% 2 64.92s 9,744 15,013
Qwen3.6 27B 2.9 7.2 11.1% 1 73.38s 3,510 20,352
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 4.1 10.0 0.0% 0 58.26s 150 583
Qwen3.6 27B 6.5 3.4 66.7% 1 39.53s 81 3,045
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 9.8 10.0 100.0% 0 11.78s 266 1,831
Qwen3.6 27B 10.0 10.0 100.0% 0 37.96s 346 6,548
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 5.9 7.2 55.6% 1 20.73s 697 2,479
Qwen3.6 27B 7.7 10.0 66.7% 0 60.21s 281 11,919
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 104.44s 234 1,531
Qwen3.6 27B 10.0 10.0 100.0% 0 16.88s 390 2,954
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 3.0 10.0 0.0% 0 113.91s 4,295 4,416
Qwen3.6 27B 3.0 10.0 0.0% 0 80.99s 401 5,807

Snelle vergelijking

Vergelijkingspaar wisselen