AI BENCHY तुलना

MoonshotAI: Kimi K2.6 vs OpenAI: GPT-5.5

सारांश

Kimi K2.6 vs GPT-5.5 benchmark तुलना: GPT-5.5 average score में आगे है: 9.3 vs 5.8. Kimi K2.6 की benchmark लागत कम है: $0.079 vs $0.907. GPT-5.5 तेज है: 9.76s vs 13.27s, pass rates 36.5% vs 85.7%.

अनुशंसित मॉडल: GPT-5.5 - It has the strongest score in this comparison (9.3) and the best overall balance of cost and response time across all 2 models.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक	Kimi K2.6 Kimi K2.6 none रिलीज़: 2026-04-20 निःशुल्क उपलब्ध	GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24

मेट्रिक	Kimi K2.6 Kimi K2.6 none रिलीज़: 2026-04-20 निःशुल्क उपलब्ध	GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24
स्कोर	5.8	9.3
रैंक	#111	#4
विश्वसनीयता	10.0	10.0
संगति	9.2	10.0
सही परीक्षण
प्रति प्रयास पास दर	36.5%	85.7%
अस्थिर टेस्ट	2	0
कुल रन	63	63
प्रति परिणाम लागत	1.267	5.035
कुल लागत	$0.079	$0.907
इनपुट कीमत	$0.680 / 1M	$5.000 / 1M
आउटपुट कीमत	$3.410 / 1M	$30.000 / 1M
कुल इनपुट टोकन	32,916	34,209
आउटपुट टोकन	16,410	2,046
रीजनिंग टोकन	0	22,460
प्रतिक्रिया समय (औसत)	13.27s	9.76s
प्रतिक्रिया समय (अधिकतम)	238.89s	56.19s
प्रतिक्रिया समय (कुल)	278.57s	204.92s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#111 MoonshotAI: Kimi K2.6

none

लागत: $0.020
समय: 127.4s
टोकन: 4,429 tok

#4 GPT-5.5

low

लागत: $0.068
समय: 37.0s
टोकन: 2,339 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	4.6	10.0	25.0%	0		1.39s	618	471	0
GPT-5.5	10.0	10.0	100.0%	0		4.41s	606	238	1,020

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	5.5	9.8	33.3%	0		82.57s	5,986	14,754	0
GPT-5.5	10.0	10.0	100.0%	0		15.04s	7,302	423	6,402

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	3.0	10.0	0.0%	0		3.38s	11,269	290	0
GPT-5.5	10.0	10.0	100.0%	0		9.56s	11,019	303	717

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	10.0	10.0	100.0%	0		1.32s	7,014	201	0
GPT-5.5	10.0	10.0	100.0%	0		3.28s	7,140	228	157

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	5.3	7.2	44.4%	1		1.48s	732	42	0
GPT-5.5	5.3	10.0	33.3%	0		28.05s	723	69	11,609

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	5.4	3.5	33.3%	1		1.55s	477	138	0
GPT-5.5	10.0	10.0	100.0%	0		5.17s	477	133	245

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	6.5	10.0	50.0%	0		1.64s	669	72	0
GPT-5.5	9.9	10.0	100.0%	0		3.74s	660	93	415

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	3.1	9.9	0.0%	0		1.40s	651	185	0
GPT-5.5	10.0	10.0	100.0%	0		4.74s	642	279	954

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	10.0	10.0	100.0%	0		4.46s	5,286	240	0
GPT-5.5	10.0	10.0	100.0%	0		4.96s	5,445	250	101

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Kimi K2.6	3.0	10.0	0.0%	0		1.36s	214	17	0
GPT-5.5	3.0	10.0	0.0%	0		10.06s	195	30	840

त्वरित तुलना

तुलना जोड़ी बदलें

GPT-5.5lowvsQwen3.7 Maxmedium North Mini Codemediumनिःशुल्क उपलब्धvsKimi K2.6noneनिःशुल्क उपलब्ध Claude Fable 5mediumvsGPT-5.5low Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Gemini 3.5 FlashmediumvsGPT-5.5low Gemini 3 Flash PreviewmediumvsGPT-5.5low Gemini 3.1 Flash LiteminimalvsKimi K2.6noneनिःशुल्क उपलब्ध GPT-5.5lowvsQwen3.6 Max Previewmedium Kimi K2.6noneनिःशुल्क उपलब्धvsQwen3.5-35B-A3Bmedium Claude Opus 4.8mediumvsGPT-5.5low Gemini 3.5 FlashhighvsGPT-5.5low Gemma 4 31Bmediumनिःशुल्क उपलब्धvsKimi K2.6noneनिःशुल्क उपलब्ध