Navigatie
AI BENCHY
Advertise here

AI BENCHY Compare

inclusionAI: Ring-2.6-1T vs MoonshotAI: Kimi K2.5

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-19

Metriek Ring-2.6-1T Ring-2.6-1T medium Releasedatum: 2026-05-10 Kimi K2.5 Kimi K2.5 medium Releasedatum: 2026-01-27
Score 7.2 6.8
Rang #60 #76
Betrouwbaarheid 9.9 10.0
Consistentie 8.7 7.0
Correcte tests
Slaagpercentage per poging 66.7% 68.4%
Instabiele tests 3 7
Totaal runs 57 57
Kosten per resultaat 0.000 2.616
Totale kosten $0.000 $0.236
Invoerprijs $0.075 / 1M $0.400 / 1M
Uitvoerprijs $0.625 / 1M $1.900 / 1M
Uitvoer-tokens 21,752 42,188
Redeneer-tokens 42,754 92,514
Responstijd (gem.) 61.29s 73.39s
Responstijd (max) 304.19s 150.77s
Responstijd (totaal) 1164.50s 880.65s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 42.21s 3,833 4,891
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 2,789 8,880
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 59.65s 1,369 3,985
Kimi K2.5 4.7 1.6 66.7% 1 150.77s 1,269 9,749
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 304.19s 324 6,088
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 6.5 10.0 50.0% 0 37.36s 840 1,937
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 563 7,940
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 3.5 4.4 33.3% 2 64.92s 9,744 15,013
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 20,753 30,564
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 4.1 10.0 0.0% 0 58.26s 150 583
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 3,815 4,262
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 9.8 10.0 100.0% 0 11.78s 266 1,831
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 5.9 7.2 55.6% 1 20.73s 697 2,479
Kimi K2.5 5.3 7.3 44.4% 1 45.40s 6,671 12,403
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 10.0 10.0 100.0% 0 104.44s 234 1,531
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Ring-2.6-1T 3.0 10.0 0.0% 0 113.91s 4,295 4,416
Kimi K2.5 3.0 10.0 0.0% 0 83.95s 12 7,644

Snelle vergelijking

Vergelijkingspaar wisselen