Navigatie
AI BENCHY
Advertise here

AI BENCHY Compare

inclusionAI: Ring-2.6-1T vs Qwen: Qwen3.5-122B-A10B

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-28

Metriek Ring-2.6-1T Ring-2.6-1T medium Releasedatum: 2026-05-10 Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Releasedatum: 2026-02-24
Score 7.2 7.7
Rang #66 #41
Betrouwbaarheid 10.0 10.0
Consistentie 8.7 8.8
Correcte tests
Slaagpercentage per poging 66.7% 71.7%
Instabiele tests 3 3
Totaal runs 60 60
Kosten per resultaat 0.000 5.031
Totale kosten $0.033 $0.509
Invoerprijs $0.075 / 1M $0.260 / 1M
Uitvoerprijs $0.625 / 1M $2.080 / 1M
Uitvoer-tokens 21,752 26,166
Redeneer-tokens 42,754 213,524
Responstijd (gem.) 61.29s 39.40s
Responstijd (max) 304.19s 168.16s
Responstijd (totaal) 1164.50s 788.00s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 42.21s 3,833 4,891
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.75s 269 16,835
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 59.65s 1,369 3,985
Qwen3.5-122B-A10B 4.1 5.8 33.3% 1 119.57s 8,036 45,074
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 304.19s 324 6,088
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 107.79s 483 11,337
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 6.5 10.0 50.0% 0 37.36s 840 1,937
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 23.41s 270 16,558
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 3.5 4.4 33.3% 2 64.92s 9,744 15,013
Qwen3.5-122B-A10B 2.9 7.2 11.1% 1 63.40s 15,537 64,889
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 4.1 10.0 0.0% 0 58.26s 150 583
Qwen3.5-122B-A10B 3.4 2.2 33.3% 1 34.11s 66 7,592
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 9.8 10.0 100.0% 0 11.78s 266 1,831
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.88s 77 7,372
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 5.9 7.2 55.6% 1 20.73s 697 2,479
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 17.89s 284 27,575
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 104.44s 234 1,531
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 4.60s 322 1,226
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 3.0 10.0 0.0% 0 113.91s 4,295 4,416
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 52.87s 822 15,066

Snelle vergelijking

Vergelijkingspaar wisselen