Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs NVIDIA: Nemotron 3 Super

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-01

Metriek Kimi K2.5 Kimi K2.5 medium Releasedatum: 2026-01-27 Nemotron 3 Super Nemotron 3 Super medium Releasedatum: 2026-03-11 Gratis beschikbaar
Score 7.0 6.7
Rang #60 #69
Betrouwbaarheid n.v.t. n.v.t.
Consistentie 6.8 8.7
Correcte tests
Slaagpercentage per poging 72.2% 55.6%
Instabiele tests 7 3
Totaal runs 54 52
Kosten per resultaat 2.444 0.000
Totale kosten $0.220 $0.000
Invoerprijs $0.440 / 1M $0.090 / 1M
Uitvoerprijs $2.000 / 1M $0.450 / 1M
Uitvoer-tokens 42,176 11,947
Redeneer-tokens 84,870 29,768
Responstijd (gem.) 72.43s 19.06s
Responstijd (max) 150.77s 87.80s
Responstijd (totaal) 796.70s 305.04s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 2,789 8,880
Nemotron 3 Super 10.0 10.0 100.0% 0 10.08s 1,776 3,345
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.5 4.7 1.6 66.7% 1 150.77s 1,269 9,749
Nemotron 3 Super 3.0 10.0 0.0% 0 0ms 0 0
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
Nemotron 3 Super 10.0 10.0 100.0% 0 87.80s 2,021 9,996
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 563 7,940
Nemotron 3 Super 10.0 10.0 100.0% 0 18.16s 877 2,607
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 20,753 30,564
Nemotron 3 Super 2.9 4.4 22.2% 2 16.19s 5,255 6,072
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 3,815 4,262
Nemotron 3 Super 3.8 9.9 0.0% 0 27.86s 104 1,149
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
Nemotron 3 Super 7.2 6.6 66.7% 1 7.72s 1,042 2,479
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.5 5.3 7.3 44.4% 1 45.40s 6,671 12,403
Nemotron 3 Super 3.5 9.8 0.0% 0 8.39s 602 2,151
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812
Nemotron 3 Super 10.0 10.0 100.0% 0 39.75s 270 1,969

Snelle vergelijking

Vergelijkingspaar wisselen