Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

inclusionAI: Ring-2.6-1T vs OpenAI: GPT-5.5

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-29

Metriek Ring-2.6-1T Ring-2.6-1T medium Releasedatum: 2026-05-10 GPT-5.5 GPT-5.5 medium Releasedatum: 2026-04-24
Score 7.2 8.7
Rang #69 #11
Betrouwbaarheid 10.0 10.0
Consistentie 8.7 8.8
Correcte tests
Slaagpercentage per poging 66.7% 86.7%
Instabiele tests 3 3
Totaal runs 60 60
Kosten per resultaat 0.000 21.884
Totale kosten $0.000 $3.502
Invoerprijs $0.075 / 1M $5.000 / 1M
Uitvoerprijs $0.625 / 1M $30.000 / 1M
Uitvoer-tokens 21,752 1,964
Redeneer-tokens 42,754 109,481
Responstijd (gem.) 61.29s 37.88s
Responstijd (max) 304.19s 332.10s
Responstijd (totaal) 1164.50s 757.66s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 42.21s 3,833 4,891
GPT-5.5 10.0 10.0 100.0% 0 4.66s 250 1,335
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 59.65s 1,369 3,985
GPT-5.5 8.2 6.7 83.3% 1 69.68s 341 19,515
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 304.19s 324 6,088
GPT-5.5 10.0 10.0 100.0% 0 19.29s 312 2,841
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 6.5 10.0 50.0% 0 37.36s 840 1,937
GPT-5.5 10.0 10.0 100.0% 0 4.18s 234 593
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 3.5 4.4 33.3% 2 64.92s 9,744 15,013
GPT-5.5 5.3 7.2 44.4% 1 164.14s 67 79,625
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 4.1 10.0 0.0% 0 58.26s 150 583
GPT-5.5 10.0 10.0 100.0% 0 4.16s 138 223
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 9.8 10.0 100.0% 0 11.78s 266 1,831
GPT-5.5 10.0 10.0 100.0% 0 3.36s 93 538
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 5.9 7.2 55.6% 1 20.73s 697 2,479
GPT-5.5 10.0 10.0 100.0% 0 6.76s 241 2,225
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 104.44s 234 1,531
GPT-5.5 10.0 10.0 100.0% 0 10.57s 258 832
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 3.0 10.0 0.0% 0 113.91s 4,295 4,416
GPT-5.5 2.8 1.6 33.3% 1 37.86s 30 1,754

Snelle vergelijking

Vergelijkingspaar wisselen