AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs Qwen: Qwen3 Coder Next

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-30

Metrică	Kimi K2.5 Kimi K2.5 none Lansare: 2026-01-27	Qwen3 Coder Next Qwen3 Coder Next none Lansare: 2026-02-03

Metrică	Kimi K2.5 Kimi K2.5 none Lansare: 2026-01-27	Qwen3 Coder Next Qwen3 Coder Next none Lansare: 2026-02-03
Scor	5.5	5.1
Rang	#100	#114
Fiabilitate	N/D	N/D
Consistență	8.7	9.7
Teste corecte
Rată de trecere pe încercare	40.7%	25.9%
Teste instabile	3	1
Rulări totale	54	54
Cost per rezultat	0.271	0.188
Cost total	$0.017	$0.008
Preț de intrare	$0.440 / 1M	$0.140 / 1M
Preț de ieșire	$2.000 / 1M	$0.800 / 1M
Tokenuri de ieșire	2,659	3,617
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	13.37s	10.18s
Timp de răspuns (maxim)	42.13s	45.14s
Timp de răspuns (total)	147.05s	122.13s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.5	3.6	8.4	8.3%	1		6.24s	373	0
Qwen3 Coder Next	3.6	10.0	0.0%	0		3.31s	1,321	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.5	10.0	10.0	100.0%	0		38.78s	649	0
Qwen3 Coder Next	7.3	3.7	66.7%	1		3.14s	585	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.5	2.8	2.1	33.3%	1		19.16s	748	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		45.14s	317	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.5	7.3	5.8	83.3%	1		42.13s	187	0
Qwen3 Coder Next	6.5	10.0	50.0%	0		1.32s	246	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.5	5.3	10.0	33.3%	0		4.38s	29	0
Qwen3 Coder Next	5.3	10.0	33.3%	0		962ms	26	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.5	10.0	10.0	100.0%	0		4.00s	76	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	152	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.5	6.5	10.0	50.0%	0		2.67s	60	0
Qwen3 Coder Next	4.8	10.0	0.0%	0		7.71s	63	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.5	3.1	10.0	0.0%	0		4.73s	317	0
Qwen3 Coder Next	3.2	10.0	0.0%	0		22.86s	652	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.5	10.0	10.0	100.0%	0		13.99s	220	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	255	0

Comparație rapidă

Schimbă perechea de comparație

Nemotron 3 Nano Omni 30b A3b ReasoningmediumDisponibil gratuitvsQwen3 Coder Nextnone Mistral Small 4mediumvsKimi K2.5none Elephant AlphamediumvsQwen3 Coder Nextnone MiniMax M2.5mediumDisponibil gratuitvsKimi K2.5none MiniMax M2.7mediumvsQwen3 Coder Nextnone MiniMax M2.7mediumvsKimi K2.5none Kimi K2.5nonevsgpt-oss-120bmediumDisponibil gratuit Kimi K2.5nonevsElephant Alphamedium Kimi K2.5nonevsNemotron 3 Nano Omni 30b A3b ReasoningmediumDisponibil gratuit Qwen3 Coder NextnonevsGLM 4.7 Flashmedium Mistral Small 4mediumvsQwen3 Coder Nextnone MiniMax M2.5mediumDisponibil gratuitvsQwen3 Coder Nextnone