Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.5 Flash vs MoonshotAI: Kimi K2.6

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-06-04

Metriek Gemini 3.5 Flash Gemini 3.5 Flash low Releasedatum: 2026-05-19 Kimi K2.6 Kimi K2.6 medium Releasedatum: 2026-04-20 Gratis beschikbaar
Score 9.4 7.2
Rang #3 #60
Betrouwbaarheid 10.0 10.0
Consistentie 10.0 8.6
Correcte tests
Slaagpercentage per poging 90.5% 65.1%
Instabiele tests 0 3
Totaal runs 63 63
Kosten per resultaat 1.834 8.358
Totale kosten $0.349 $0.891
Invoerprijs $1.500 / 1M $0.684 / 1M
Uitvoerprijs $9.000 / 1M $3.420 / 1M
Totaal aantal invoer-tokens 36,938 29,450
Uitvoer-tokens 2,033 102,923
Redeneer-tokens 30,519 254,094
Responstijd (gem.) 3.27s 71.67s
Responstijd (max) 9.05s 406.78s
Responstijd (totaal) 68.65s 1433.36s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 494 209 2,536
Kimi K2.6 7.0 8.0 66.7% 1 11.59s 618 7,115 8,934
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 7.8 10.0 66.7% 0 6.71s 8,118 458 13,420
Kimi K2.6 5.7 8.6 33.3% 0 214.42s 2,925 9,970 77,189
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.44s 12,873 351 3,050
Kimi K2.6 10.0 10.0 100.0% 0 40.96s 11,271 711 13,876
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.81s 7,548 279 1,164
Kimi K2.6 10.0 10.0 100.0% 0 20.38s 7,014 316 11,305
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 7.7 10.0 66.7% 0 3.39s 633 12 4,538
Kimi K2.6 5.3 7.2 44.4% 1 202.38s 326 47,035 98,262
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.27s 486 119 916
Kimi K2.6 10.0 10.0 100.0% 0 17.83s 477 3,981 4,472
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 9.9 10.0 100.0% 0 1.86s 615 71 1,652
Kimi K2.6 10.0 10.0 100.0% 0 12.53s 669 3,977 5,269
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.35s 558 288 2,150
Kimi K2.6 6.0 7.4 55.6% 1 25.06s 651 13,860 17,599
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.27s 5,457 234 403
Kimi K2.6 10.0 10.0 100.0% 0 8.92s 5,286 248 1,011
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.88s 156 12 690
Kimi K2.6 3.0 10.0 0.0% 0 130.27s 213 15,710 16,177

Snelle vergelijking

Vergelijkingspaar wisselen