Navigatie
AI BENCHY
Your ad here

AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs OpenAI: GPT-5.4 Nano

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-30

Metriek Kimi K2.6 Kimi K2.6 medium Releasedatum: 2026-04-20 GPT-5.4 Nano GPT-5.4 Nano medium Releasedatum: 2026-03-17
Score 7.7 7.6
Rang #47 #50
Betrouwbaarheid n.v.t. n.v.t.
Consistentie 8.3 9.0
Correcte tests
Slaagpercentage per poging 74.1% 68.5%
Instabiele tests 4 2
Totaal runs 54 54
Kosten per resultaat 6.563 0.747
Totale kosten $0.722 $0.083
Invoerprijs $0.740 / 1M $0.200 / 1M
Uitvoerprijs $3.490 / 1M $1.250 / 1M
Uitvoer-tokens 80,759 2,946
Redeneer-tokens 179,814 58,132
Responstijd (gem.) 45.20s 11.21s
Responstijd (max) 215.85s 94.06s
Responstijd (totaal) 768.37s 201.80s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 7.0 8.0 66.7% 1 11.59s 7,115 8,934
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 10.0 10.0 100.0% 0 106.96s 3,236 18,817
GPT-5.4 Nano 10.0 10.0 100.0% 0 13.41s 472 3,616
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 10.0 10.0 100.0% 0 40.96s 711 13,876
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 10.0 10.0 100.0% 0 20.38s 316 11,305
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 5.3 7.2 44.4% 1 202.38s 47,035 98,262
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 10.0 10.0 100.0% 0 17.83s 3,981 4,472
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 10.0 10.0 100.0% 0 12.53s 3,977 5,269
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 5.0 5.2 44.5% 2 25.59s 14,140 17,868
GPT-5.4 Nano 4.0 7.1 22.2% 1 3.65s 640 1,356
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 10.0 10.0 100.0% 0 8.92s 248 1,011
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382

Snelle vergelijking

Vergelijkingspaar wisselen