AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs Qwen: Qwen3.5-9B

Rezumat

Comparație benchmark Kimi K2.6 vs Qwen3.5-9B: Kimi K2.6 conduce la scorul mediu cu 5.5 vs 4.6. Qwen3.5-9B are costul de benchmark mai mic, $0.006 vs $0.079. Qwen3.5-9B este mai rapid cu 1.89s vs 13.27s, cu rate de reușită de 36.5% vs 20.6%.

Model recomandat: Qwen3.5-9B - Oferă cel mai bun compromis per total: scor competitiv (4.6), cost mai mic decât Kimi K2.6 și timp de răspuns echilibrat.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-10

Metrică	Kimi K2.6 Kimi K2.6 none Lansare: 2026-04-20 Disponibil gratuit	Qwen3.5-9B Qwen3.5-9B none Lansare: 2026-03-02

Metrică	Kimi K2.6 Kimi K2.6 none Lansare: 2026-04-20 Disponibil gratuit	Qwen3.5-9B Qwen3.5-9B none Lansare: 2026-03-02
Scor	5.5	4.6
Rang	#125	#155
Fiabilitate	10.0	10.0
Consistență	9.2	9.7
Teste corecte
Rată de trecere pe încercare	36.5%	20.6%
Teste instabile	2	1
Rulări totale	63	63
Cost per rezultat	1.267	0.123
Cost total	$0.079	$0.006
Preț de intrare	$0.680 / 1M	$0.100 / 1M
Preț de ieșire	$3.410 / 1M	$0.150 / 1M
Total tokenuri de intrare	32,916	48,041
Tokenuri de ieșire	16,410	3,952
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	13.27s	1.89s
Timp de răspuns (maxim)	238.89s	6.03s
Timp de răspuns (total)	278.57s	39.68s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#125 MoonshotAI: Kimi K2.6

none

Cost: $0.020
Time: 127.4s
Tokens: 4,429 tok

#155 Qwen3.5-9B

none

Invalid SVG

Cost: $0.000
Time: 300.0s
Tokens: 0 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	4.6	10.0	25.0%	0		1.39s	618	471	0
Qwen3.5-9B	3.1	9.9	0.0%	0		1.71s	696	582	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	5.5	9.8	33.3%	0		82.57s	5,986	14,754	0
Qwen3.5-9B	3.9	7.8	11.1%	1		5.60s	7,913	1,042	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	3.0	10.0	0.0%	0		3.38s	11,269	290	0
Qwen3.5-9B	3.0	10.0	0.0%	0		5.91s	20,397	1,255	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	10.0	10.0	100.0%	0		1.32s	7,014	201	0
Qwen3.5-9B	10.0	10.0	100.0%	0		847ms	7,788	249	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	5.3	7.2	44.4%	1		1.48s	732	42	0
Qwen3.5-9B	3.0	10.0	0.0%	0		464ms	789	24	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	5.4	3.5	33.3%	1		1.55s	477	138	0
Qwen3.5-9B	4.4	9.9	0.0%	0		552ms	522	99	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	6.5	10.0	50.0%	0		1.64s	669	72	0
Qwen3.5-9B	6.5	10.0	50.0%	0		514ms	711	75	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	3.1	9.9	0.0%	0		1.40s	651	185	0
Qwen3.5-9B	3.2	10.0	0.0%	0		621ms	714	347	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	10.0	10.0	100.0%	0		4.46s	5,286	240	0
Qwen3.5-9B	10.0	10.0	100.0%	0		1.27s	8,301	273	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	3.0	10.0	0.0%	0		1.36s	214	17	0
Qwen3.5-9B	3.0	10.0	0.0%	0		2.32s	210	6	0

Comparație rapidă

Schimbă perechea de comparație