MoonshotAI: Kimi K2.6 vs Qwen: Qwen3.7 Max

Qwen3.7 Max conduce la scorul mediu cu 7.4 vs 7.2. Qwen3.7 Max are costul de benchmark mai mic, $0.197 vs $1.036. Qwen3.7 Max este mai rapid cu 4.52s vs 109.98s, cu rate de reușită de 63.6% vs 68.2%.

Model recomandatQwen3.7 MaxAre cel mai bun scor aici (7.4) și costă de aproximativ 5.3x mai puțin decât Kimi K2.6 (medium).

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-20

Metrică	Kimi K2.6 Kimi K2.6 medium Lansare: 2026-04-20	Qwen3.7 Max Qwen3.7 Max none Lansare: 2026-05-22

Metrică	Kimi K2.6 Kimi K2.6 medium Lansare: 2026-04-20	Qwen3.7 Max Qwen3.7 Max none Lansare: 2026-05-22
Scor	7.2	7.4
Rang	#68	#59
Fiabilitate	9.4	9.9
Consistență	8.3	10.0
Teste corecte
Rată de trecere pe încercare	63.6%	68.2%
Teste instabile	4	0
Rulări totale	66	66
Cost per rezultat	9.821	1.582
Cost total	$1.036	$0.197
Preț de intrare	$0.684 / 1M	$1.475 / 1M
Preț de ieșire	$3.420 / 1M	$4.425 / 1M
Total tokenuri de intrare	68,902	95,983
Tokenuri de ieșire	111,680	12,446
Tokenuri de raționament	279,860	0
Timp de răspuns (mediu)	109.98s	4.52s
Timp de răspuns (maxim)	876.20s	72.30s
Timp de răspuns (total)	2309.56s	99.52s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#68 MoonshotAI: Kimi K2.6

medium

Cost: $0.013
Timp: 103.4s
Tokenuri: 3,620 tok

#59 Qwen3.7 Max

none

Cost: $0.046
Timp: 195.0s
Tokenuri: 12,171 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	7.0	8.0	66.7%	1		11.59s	618	7,115	8,934
Qwen3.7 Max	6.5	10.0	50.0%	0		1.08s	696	242	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	5.7	8.6	33.3%	0		214.42s	2,925	9,970	77,189
Qwen3.7 Max	5.5	10.0	33.3%	0		1.35s	7,911	582	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	6.9	5.9	66.7%	1		458.58s	50,723	9,468	39,642
Qwen3.7 Max	6.5	10.0	50.0%	0		37.23s	68,425	10,623	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	10.0	10.0	100.0%	0		20.38s	7,014	316	11,305
Qwen3.7 Max	10.0	10.0	100.0%	0		1.35s	7,794	243	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	5.3	7.2	44.4%	1		202.38s	326	47,035	98,262
Qwen3.7 Max	7.7	10.0	66.7%	0		975ms	789	15	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	10.0	10.0	100.0%	0		17.83s	477	3,981	4,472
Qwen3.7 Max	10.0	10.0	100.0%	0		1.04s	522	120	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	10.0	10.0	100.0%	0		12.53s	669	3,977	5,269
Qwen3.7 Max	10.0	10.0	100.0%	0		943ms	711	72	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	6.0	7.4	55.6%	1		25.06s	651	13,860	17,599
Qwen3.7 Max	10.0	10.0	100.0%	0		1.13s	714	314	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	10.0	10.0	100.0%	0		8.92s	5,286	248	1,011
Qwen3.7 Max	10.0	10.0	100.0%	0		3.92s	8,211	222	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Kimi K2.6	3.0	10.0	0.0%	0		130.27s	213	15,710	16,177
Qwen3.7 Max	3.0	10.0	0.0%	0		856ms	210	13	0

Comparație rapidă

Schimbă perechea de comparație

KAT-Coder-Pro V2.5highvsKimi K2.6medium Kimi K2.6mediumvsStep 3.7 Flashlow LongCat 2.0mediumvsQwen3.7 Maxnone Claude Opus 4.8nonevsKimi K2.6medium GPT-5.4 MinimediumvsQwen3.7 Maxnone GPT-5.6 TerralowvsQwen3.7 Maxnone Gemini 3 Flash PreviewlowvsQwen3.7 Maxnone KAT-Coder-Pro V2.5lowvsQwen3.7 Maxnone Kimi K2.6mediumvsQwen3.7 Plusnone GPT-5.4 NanomediumvsQwen3.7 Maxnone Kimi K2.7 CodemediumvsQwen3.7 Maxnone Nemotron 3 UltramediumDisponibil gratuitvsQwen3.7 Maxnone