AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs OpenAI: GPT-5.5

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-24

المقياس	Kimi K2.6 Kimi K2.6 medium الإصدار: 2026-04-20	GPT-5.5 GPT-5.5 none الإصدار: 2026-04-24

المقياس	Kimi K2.6 Kimi K2.6 medium الإصدار: 2026-04-20	GPT-5.5 GPT-5.5 none الإصدار: 2026-04-24
النتيجة	7.7	6.8
الترتيب	#42	#58
الموثوقية	غير متاح	غير متاح
الاتساق	8.3	8.3
اختبارات صحيحة
معدل النجاح لكل محاولة	74.1%	61.1%
اختبارات غير مستقرة	4	4
إجمالي مرات التشغيل	54	54
التكلفة لكل نتيجة	6.563	2.162
إجمالي التكلفة	$0.722	$0.195
??? ???????	$0.745 / 1M	$5.000 / 1M
??? ???????	$4.655 / 1M	$30.000 / 1M
رموز الإخراج	80,759	1,910
رموز الاستدلال	179,814	0
زمن الاستجابة (المتوسط)	45.20s	1.83s
زمن الاستجابة (الحد الأقصى)	215.85s	5.56s
زمن الاستجابة (الإجمالي)	768.37s	32.86s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.6	7.0	8.0	66.7%	1		11.59s	7,115	8,934
GPT-5.5	6.9	7.9	66.7%	1		1.31s	213	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.6	10.0	10.0	100.0%	0		106.96s	3,236	18,817
GPT-5.5	10.0	10.0	100.0%	0		2.05s	426	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.6	10.0	10.0	100.0%	0		40.96s	711	13,876
GPT-5.5	3.0	10.0	0.0%	0		5.56s	300	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.6	10.0	10.0	100.0%	0		20.38s	316	11,305
GPT-5.5	10.0	10.0	100.0%	0		1.18s	222	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.6	5.3	7.2	44.4%	1		202.38s	47,035	98,262
GPT-5.5	2.9	7.2	11.1%	1		1.31s	52	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.6	10.0	10.0	100.0%	0		17.83s	3,981	4,472
GPT-5.5	10.0	10.0	100.0%	0		3.41s	124	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.6	10.0	10.0	100.0%	0		12.53s	3,977	5,269
GPT-5.5	6.2	5.8	66.7%	1		1.15s	81	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.6	5.0	5.2	44.5%	2		25.59s	14,140	17,868
GPT-5.5	6.7	7.9	55.6%	1		1.36s	245	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.6	10.0	10.0	100.0%	0		8.92s	248	1,011
GPT-5.5	10.0	10.0	100.0%	0		3.90s	247	0

مقارنة سريعة

تبديل زوج المقارنة

Nemotron 3 Supermediumمتاح مجانًاvsGPT-5.5none Kimi K2.6mediumvsGPT-5.3 Chatnone GPT-5.5nonevsGrok 4.1 Fastmedium DeepSeek V4 FlashhighvsKimi K2.6medium Gemini 3.1 Flash Lite PreviewnonevsKimi K2.6medium Kimi K2.6mediumvsGPT-5.2 Chatnone GPT-5.5nonevsGrok 4.20medium Kimi K2.5mediumvsGPT-5.5none Mercury 2mediumvsGPT-5.5none Claude Sonnet 4.6nonevsKimi K2.6medium Gemini 3.1 Flash Lite PreviewlowvsKimi K2.6medium Gemini 3 Flash PreviewnonevsKimi K2.6medium