AI BENCHY तुलना

MoonshotAI: Kimi K2.6 vs Qwen: Qwen3.5-9B

सारांश

Kimi K2.6 vs Qwen3.5-9B benchmark तुलना: Kimi K2.6 average score में आगे है: 5.5 vs 4.6. Qwen3.5-9B की benchmark लागत कम है: $0.006 vs $0.079. Qwen3.5-9B तेज है: 1.89s vs 13.27s, pass rates 36.5% vs 20.6%.

अनुशंसित मॉडल: Qwen3.5-9B - It offers the best overall trade-off: a competitive score (4.6), lower cost than Kimi K2.6, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-10

मेट्रिक	Kimi K2.6 Kimi K2.6 none रिलीज़: 2026-04-20 निःशुल्क उपलब्ध	Qwen3.5-9B Qwen3.5-9B none रिलीज़: 2026-03-02

मेट्रिक	Kimi K2.6 Kimi K2.6 none रिलीज़: 2026-04-20 निःशुल्क उपलब्ध	Qwen3.5-9B Qwen3.5-9B none रिलीज़: 2026-03-02
स्कोर	5.5	4.6
रैंक	#125	#155
विश्वसनीयता	10.0	10.0
संगति	9.2	9.7
सही परीक्षण
प्रति प्रयास पास दर	36.5%	20.6%
अस्थिर टेस्ट	2	1
कुल रन	63	63
प्रति परिणाम लागत	1.267	0.123
कुल लागत	$0.079	$0.006
इनपुट कीमत	$0.680 / 1M	$0.100 / 1M
आउटपुट कीमत	$3.410 / 1M	$0.150 / 1M
कुल इनपुट टोकन	32,916	48,041
आउटपुट टोकन	16,410	3,952
रीजनिंग टोकन	0	0
प्रतिक्रिया समय (औसत)	13.27s	1.89s
प्रतिक्रिया समय (अधिकतम)	238.89s	6.03s
प्रतिक्रिया समय (कुल)	278.57s	39.68s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#125 MoonshotAI: Kimi K2.6

none

Cost: $0.020
Time: 127.4s
Tokens: 4,429 tok

#155 Qwen3.5-9B

none

Invalid SVG

Cost: $0.000
Time: 300.0s
Tokens: 0 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	4.6	10.0	25.0%	0		1.39s	618	471	0
Qwen3.5-9B	3.1	9.9	0.0%	0		1.71s	696	582	0

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	5.5	9.8	33.3%	0		82.57s	5,986	14,754	0
Qwen3.5-9B	3.9	7.8	11.1%	1		5.60s	7,913	1,042	0

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	3.0	10.0	0.0%	0		3.38s	11,269	290	0
Qwen3.5-9B	3.0	10.0	0.0%	0		5.91s	20,397	1,255	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	10.0	10.0	100.0%	0		1.32s	7,014	201	0
Qwen3.5-9B	10.0	10.0	100.0%	0		847ms	7,788	249	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	5.3	7.2	44.4%	1		1.48s	732	42	0
Qwen3.5-9B	3.0	10.0	0.0%	0		464ms	789	24	0

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	5.4	3.5	33.3%	1		1.55s	477	138	0
Qwen3.5-9B	4.4	9.9	0.0%	0		552ms	522	99	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	6.5	10.0	50.0%	0		1.64s	669	72	0
Qwen3.5-9B	6.5	10.0	50.0%	0		514ms	711	75	0

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	3.1	9.9	0.0%	0		1.40s	651	185	0
Qwen3.5-9B	3.2	10.0	0.0%	0		621ms	714	347	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	10.0	10.0	100.0%	0		4.46s	5,286	240	0
Qwen3.5-9B	10.0	10.0	100.0%	0		1.27s	8,301	273	0

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	3.0	10.0	0.0%	0		1.36s	214	17	0
Qwen3.5-9B	3.0	10.0	0.0%	0		2.32s	210	6	0

त्वरित तुलना

तुलना जोड़ी बदलें