AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs Z.ai: GLM 5

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-20

المقياس	Kimi K2.6 Kimi K2.6 medium الإصدار: 2026-04-20	GLM 5 GLM 5 none الإصدار: 2026-02-12

المقياس	Kimi K2.6 Kimi K2.6 medium الإصدار: 2026-04-20	GLM 5 GLM 5 none الإصدار: 2026-02-12
النتيجة	7.7	6.6
الترتيب	#34	#53
الاتساق	8.3	9.6
اختبارات صحيحة
معدل النجاح لكل محاولة	74.1%	51.9%
اختبارات غير مستقرة	4	1
إجمالي مرات التشغيل	54	54
التكلفة لكل نتيجة	6.563	0.217
إجمالي التكلفة	$0.722	$0.020
??? ???????	$0.950 / 1M	$0.700 / 1M
??? ???????	$4.000 / 1M	$0.140 / 1M
رموز الإخراج	80,759	1,959
رموز الاستدلال	179,814	0
زمن الاستجابة (المتوسط)	45.20s	4.23s
زمن الاستجابة (الحد الأقصى)	215.85s	11.07s
زمن الاستجابة (الإجمالي)	768.37s	46.51s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.6	7.0	8.0	66.7%	1		11.59s	7,115	8,934
GLM 5	4.8	10.0	25.0%	0		2.37s	275	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.6	10.0	10.0	100.0%	0		106.96s	3,236	18,817
GLM 5	5.6	3.5	33.3%	1		8.84s	408	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.6	10.0	10.0	100.0%	0		40.96s	711	13,876
GLM 5	3.0	10.0	0.0%	0		4.98s	406	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.6	10.0	10.0	100.0%	0		20.38s	316	11,305
GLM 5	10.0	10.0	100.0%	0		5.78s	203	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.6	5.3	7.2	44.4%	1		202.38s	47,035	98,262
GLM 5	3.0	10.0	0.0%	0		2.24s	19	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.6	10.0	10.0	100.0%	0		17.83s	3,981	4,472
GLM 5	10.0	10.0	100.0%	0		3.27s	103	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.6	10.0	10.0	100.0%	0		12.53s	3,977	5,269
GLM 5	10.0	10.0	100.0%	0		1.48s	61	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.6	5.0	5.2	44.5%	2		25.59s	14,140	17,868
GLM 5	7.7	10.0	66.7%	0		2.05s	264	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.6	10.0	10.0	100.0%	0		8.92s	248	1,011
GLM 5	10.0	10.0	100.0%	0		11.07s	220	0

مقارنة سريعة

تبديل زوج المقارنة

Grok 4.1 FastmediumvsGLM 5none Kimi K2.6mediumvsGPT-5.3 Chatnone Nemotron 3 Supermediumمتاح مجانًاvsGLM 5none Mercury 2mediumvsGLM 5none Gemini 3.1 Flash Lite PreviewnonevsKimi K2.6medium Kimi K2.6mediumvsGPT-5.2 Chatnone Claude Sonnet 4.6nonevsKimi K2.6medium Grok 4.20mediumvsGLM 5none Kimi K2.5mediumvsGLM 5none Gemini 3.1 Flash Lite PreviewlowvsKimi K2.6medium GPT-5 MinimediumvsGLM 5none GPT-5 NanomediumvsGLM 5none