MoonshotAI: Kimi K2.6 vs Qwen: Qwen3.5-122B-A10B

Kimi K2.6 (medium) conduce la scorul mediu cu 7.2 vs 7.1. Qwen3.5-122B-A10B (medium) are costul de benchmark mai mic, $1.046 vs $1.222. Qwen3.5-122B-A10B (medium) este mai rapid cu 64.16s vs 109.98s, cu rate de reușită de 63.6% vs 71.2%.

Model recomandatQwen3.5-122B-A10B (medium)Scorul rămâne aproape de cel mai bun scor de aici (7.1 vs 7.2) și răspunde de aproximativ 1.7x mai rapid decât Kimi K2.6 (medium).

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-18

Metrică	Kimi K2.6 Kimi K2.6 medium Lansare: 2026-04-20	Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Lansare: 2026-02-24

Metrică	Kimi K2.6 Kimi K2.6 medium Lansare: 2026-04-20	Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Lansare: 2026-02-24
Scor	7.2	7.1
Rang	#67	#71
Fiabilitate	9.4	10.0
Consistență	8.3	8.5
Teste corecte
Rată de trecere pe încercare	63.6%	71.2%
Teste instabile	4	4
Rulări totale	66	66
Cost per rezultat	9.821	8.509
Cost total	$1.222	$1.046
Preț de intrare	$0.950 / 1M	$0.260 / 1M
Preț de ieșire	$4.000 / 1M	$2.080 / 1M
Total tokenuri de intrare	68,902	124,771
Tokenuri de ieșire	111,680	44,077
Tokenuri de raționament	279,860	443,141
Timp de răspuns (mediu)	109.98s	64.16s
Timp de răspuns (maxim)	876.20s	519.30s
Timp de răspuns (total)	2309.56s	1411.60s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#67 MoonshotAI: Kimi K2.6

medium

Cost: $0.013
Timp: 103.4s
Tokenuri: 3,620 tok

#71 Qwen3.5-122B-A10B

medium

Cost: $0.019
Timp: 48.7s
Tokenuri: 6,034 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	7.0	8.0	66.7%	1		11.59s	618	7,115	8,934
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		9.75s	672	269	16,835

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	5.7	8.6	33.3%	0		214.42s	2,925	9,970	77,189
Qwen3.5-122B-A10B	6.0	7.2	55.6%	1		114.48s	7,630	8,057	82,578

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	6.9	5.9	66.7%	1		458.58s	50,723	9,468	39,642
Qwen3.5-122B-A10B	6.4	5.8	66.7%	1		313.55s	97,886	18,373	203,450

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	10.0	10.0	100.0%	0		20.38s	7,014	316	11,305
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		23.41s	7,782	270	16,558

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	5.3	7.2	44.4%	1		202.38s	326	47,035	98,262
Qwen3.5-122B-A10B	2.9	7.2	11.1%	1		63.40s	771	15,537	64,889

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	10.0	10.0	100.0%	0		17.83s	477	3,981	4,472
Qwen3.5-122B-A10B	3.4	2.2	33.3%	1		34.11s	344	66	7,592

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	10.0	10.0	100.0%	0		12.53s	669	3,977	5,269
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		9.88s	593	77	7,372

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	6.0	7.4	55.6%	1		25.06s	651	13,860	17,599
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		17.89s	696	284	27,575

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	10.0	10.0	100.0%	0		8.92s	5,286	248	1,011
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		4.60s	8,193	322	1,226

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	3.0	10.0	0.0%	0		130.27s	213	15,710	16,177
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		52.87s	204	822	15,066

Comparație rapidă

Schimbă perechea de comparație

KAT-Coder-Pro V2.5highvsKimi K2.6medium Kimi K2.6mediumvsStep 3.7 Flashlow Claude Opus 4.8nonevsKimi K2.6medium Kimi K2.6mediumvsQwen3.7 Plusnone KAT-Coder-Pro V2.5highvsQwen3.5-122B-A10Bmedium Claude Sonnet 4.6nonevsKimi K2.6medium Qwen3.5-122B-A10BmediumvsStep 3.7 Flashlow Claude Opus 4.8nonevsQwen3.5-122B-A10Bmedium KAT-Coder-Pro V2.5lowvsKimi K2.6medium Gemini 3 Flash PreviewlowvsKimi K2.6medium Gemini 3.5 FlashnonevsQwen3.5-122B-A10Bmedium Claude Sonnet 4.6nonevsQwen3.5-122B-A10Bmedium