AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#40

Kimi K2.5

Moonshot AI · Releasedatum: 2026-01-27 · moonshotai/kimi-k2.5::medium

Score

7.2

Consistentie

7.2

Totale kosten

$0.201

Totaal aantal uitvoer-tokens

116,028

Invoerprijs

$0.383 / 1M

Uitvoerprijs

$1.720 / 1M

Correcte tests

Foute tests: 8

Slaagpercentage per poging: 72.6%

Instabiele tests

6

Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).

Responstijd (gem.)

64.59s

Responstijd (max): 137.29s

Responstijd (totaal): 645.93s

Grafieken

Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Snelle vergelijking

Categorie-uitsplitsing

Categorie Score Consistentie Correcte tests
Anti-AI-trucs 7.3 5.8
Gecombineerd 10.0 10.0
Gegevensparsering en extractie 10.0 10.0
Domeinspecifiek 3.5 4.4
Algemene intelligentie 6.5 3.4
Instructies opvolgen 10.0 10.0
Puzzeloplossing 5.3 7.3
Toolaanroepen 10.0 10.0

Vergeleken modellen