Navigatie
AI BENCHY
Advertise here

AI BENCHY Compare

inclusionAI: Ring-2.6-1T vs Qwen: Qwen3.5-35B-A3B

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-28

Metriek Ring-2.6-1T Ring-2.6-1T medium Releasedatum: 2026-05-10 Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Releasedatum: 2026-02-24
Score 7.2 7.3
Rang #66 #65
Betrouwbaarheid 10.0 10.0
Consistentie 8.7 7.5
Correcte tests
Slaagpercentage per poging 66.7% 73.3%
Instabiele tests 3 6
Totaal runs 60 60
Kosten per resultaat 0.000 4.865
Totale kosten $0.033 $0.368
Invoerprijs $0.075 / 1M $0.139 / 1M
Uitvoerprijs $0.625 / 1M $1.000 / 1M
Uitvoer-tokens 21,752 31,242
Redeneer-tokens 42,754 330,546
Responstijd (gem.) 61.29s 69.66s
Responstijd (max) 304.19s 409.98s
Responstijd (totaal) 1164.50s 1393.17s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 42.21s 3,833 4,891
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.13s 798 42,652
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 59.65s 1,369 3,985
Qwen3.5-35B-A3B 6.5 10.0 50.0% 0 244.54s 14,456 88,431
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 304.19s 324 6,088
Qwen3.5-35B-A3B 4.7 1.6 66.7% 1 75.34s 775 12,485
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 6.5 10.0 50.0% 0 37.36s 840 1,937
Qwen3.5-35B-A3B 7.3 5.9 83.3% 1 59.33s 235 19,493
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 3.5 4.4 33.3% 2 64.92s 9,744 15,013
Qwen3.5-35B-A3B 4.1 4.4 44.5% 2 88.34s 41 46,368
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 4.1 10.0 0.0% 0 58.26s 150 583
Qwen3.5-35B-A3B 2.8 1.6 33.3% 1 30.30s 20 3,753
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 9.8 10.0 100.0% 0 11.78s 266 1,831
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 97 17,361
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 5.9 7.2 55.6% 1 20.73s 697 2,479
Qwen3.5-35B-A3B 8.2 7.2 88.9% 1 33.13s 3,592 26,585
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 104.44s 234 1,531
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 309 1,365
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 3.0 10.0 0.0% 0 113.91s 4,295 4,416
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 177.35s 10,919 72,053

Snelle vergelijking

Vergelijkingspaar wisselen