AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs Z.ai: GLM 5

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-29

Metriek	Kimi K2.5 Kimi K2.5 medium Releasedatum: 2026-01-27	GLM 5 GLM 5 none Releasedatum: 2026-02-12

Metriek	Kimi K2.5 Kimi K2.5 medium Releasedatum: 2026-01-27	GLM 5 GLM 5 none Releasedatum: 2026-02-12
Score	6.7	6.3
Rang	#85	#96
Betrouwbaarheid	10.0	10.0
Consistentie	6.8	9.7
Correcte tests
Slaagpercentage per poging	66.7%	46.7%
Instabiele tests	8	1
Totaal runs	60	60
Kosten per resultaat	3.486	0.246
Totale kosten	$0.314	$0.023
Invoerprijs	$0.400 / 1M	$0.600 / 1M
Uitvoerprijs	$1.900 / 1M	$1.920 / 1M
Uitvoer-tokens	48,374	1,985
Redeneer-tokens	128,473	0
Responstijd (gem.)	89.02s	3.95s
Responstijd (max)	281.00s	11.07s
Responstijd (totaal)	1157.32s	51.38s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.5	7.3	5.8	83.3%	2		51.38s	2,789	8,880
GLM 5	4.8	10.0	25.0%	0		2.37s	275	0

Programmeren	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.5	4.1	1.9	50.0%	2		215.89s	5,700	45,419
GLM 5	4.6	6.8	16.7%	1		5.18s	424	0

Gecombineerd	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.5	10.0	10.0	100.0%	0		71.37s	703	3,713
GLM 5	3.0	10.0	0.0%	0		4.98s	406	0

Gegevensparsering en extractie	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.5	10.0	10.0	100.0%	0		49.78s	563	7,940
GLM 5	10.0	10.0	100.0%	0		5.78s	203	0

Domeinspecifiek	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.5	3.5	4.4	33.3%	2		137.29s	20,753	30,564
GLM 5	3.0	10.0	0.0%	0		2.24s	19	0

Algemene intelligentie	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.5	6.5	3.4	66.7%	1		69.73s	3,815	4,262
GLM 5	10.0	10.0	100.0%	0		3.27s	103	0

Instructies opvolgen	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.5	10.0	10.0	100.0%	0		92.47s	5,371	6,547
GLM 5	10.0	10.0	100.0%	0		1.48s	61	0

Puzzeloplossing	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.5	5.3	7.3	44.4%	1		43.23s	8,426	12,692
GLM 5	7.7	10.0	66.7%	0		1.91s	261	0

Toolaanroepen	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.5	10.0	10.0	100.0%	0		31.74s	242	812
GLM 5	10.0	10.0	100.0%	0		11.07s	220	0

Algemene kennis	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Responstijd (gem.)	Uitvoer-tokens	Redeneer-tokens
Kimi K2.5	3.0	10.0	0.0%	0		83.95s	12	7,644
GLM 5	3.0	10.0	0.0%	0		3.62s	13	0

Snelle vergelijking

Vergelijkingspaar wisselen

Gemini 3.1 Flash LiteminimalvsKimi K2.5medium Gemma 4 31BnoneGratis beschikbaarvsKimi K2.5medium Gemini 3.1 Flash LitenonevsKimi K2.5medium Kimi K2.5mediumvsGPT-5.5none GPT-5 NanomediumvsGLM 5none Mercury 2mediumvsGLM 5none Kimi K2.5mediumvsQwen3.5 Plus 2026-02-15none Qwen3.6 27BmediumvsGLM 5none Gemini 2.5 FlashnonevsKimi K2.5medium DeepSeek V4 ProhighvsKimi K2.5medium Nemotron 3 SupermediumGratis beschikbaarvsGLM 5none Claude Sonnet 4.6nonevsKimi K2.5medium