Navigatie
AI BENCHY
Advertise here

AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs Qwen: Qwen3.5-122B-A10B

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-22

Metriek Kimi K2.6 Kimi K2.6 medium Releasedatum: 2026-04-20 Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Releasedatum: 2026-02-24
Score 7.4 7.7
Rang #54 #38
Betrouwbaarheid 8.3 10.0
Consistentie 8.3 8.8
Correcte tests
Slaagpercentage per poging 70.8% 71.7%
Instabiele tests 4 3
Totaal runs 60 60
Kosten per resultaat 7.630 4.997
Totale kosten $0.916 $0.650
Invoerprijs $0.730 / 1M $0.260 / 1M
Uitvoerprijs $3.490 / 1M $2.080 / 1M
Uitvoer-tokens 102,488 26,171
Redeneer-tokens 229,389 212,114
Responstijd (gem.) 54.11s 39.29s
Responstijd (max) 215.85s 168.16s
Responstijd (totaal) 1028.14s 785.87s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 7.0 8.0 66.7% 1 11.59s 7,115 8,934
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.75s 269 16,835
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 6.5 5.3 75.0% 1 118.23s 9,255 52,215
Qwen3.5-122B-A10B 4.1 5.8 33.3% 1 119.57s 8,036 45,074
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 10.0 10.0 100.0% 0 40.96s 711 13,876
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 107.79s 483 11,337
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 10.0 10.0 100.0% 0 20.38s 316 11,305
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 23.41s 270 16,558
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 5.3 7.2 44.4% 1 202.38s 47,035 98,262
Qwen3.5-122B-A10B 2.9 7.2 11.1% 1 63.40s 15,537 64,889
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 10.0 10.0 100.0% 0 17.83s 3,981 4,472
Qwen3.5-122B-A10B 3.4 2.2 33.3% 1 34.11s 66 7,592
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 10.0 10.0 100.0% 0 12.53s 3,977 5,269
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.88s 77 7,372
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 6.0 7.4 55.6% 1 25.59s 14,140 17,868
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 17.18s 289 26,165
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 10.0 10.0 100.0% 0 8.92s 248 1,011
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 4.60s 322 1,226
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Kimi K2.6 3.0 10.0 0.0% 0 130.27s 15,710 16,177
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 52.87s 822 15,066

Snelle vergelijking

Vergelijkingspaar wisselen