AI BENCHY Compare

OpenAI: GPT-5.4 vs Z.ai: GLM 5

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-16

المقياس	GPT-5.4 GPT-5.4 medium الإصدار: 2026-03-05	GLM 5 GLM 5 none الإصدار: 2026-02-12

المقياس	GPT-5.4 GPT-5.4 medium الإصدار: 2026-03-05	GLM 5 GLM 5 none الإصدار: 2026-02-12
النتيجة	8.2	6.6
الترتيب	#16	#52
الاتساق	8.7	9.6
اختبارات صحيحة
معدل النجاح لكل محاولة	79.6%	51.9%
اختبارات غير مستقرة	3	1
إجمالي مرات التشغيل	54	54
التكلفة لكل نتيجة	6.399	0.217
إجمالي التكلفة	$0.832	$0.020
??? ???????	$2.500 / 1M	$0.720 / 1M
??? ???????	$15.000 / 1M	$2.300 / 1M
رموز الإخراج	2,169	1,959
رموز الاستدلال	48,732	0
زمن الاستجابة (المتوسط)	18.63s	4.23s
زمن الاستجابة (الحد الأقصى)	100.41s	11.07s
زمن الاستجابة (الإجمالي)	335.26s	46.51s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.4	8.3	10.0	75.0%	0		4.11s	240	1,511
GLM 5	4.8	10.0	25.0%	0		2.37s	275	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.4	10.0	10.0	100.0%	0		13.03s	389	2,045
GLM 5	5.6	3.5	33.3%	1		8.84s	408	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.4	10.0	10.0	100.0%	0		20.57s	301	3,543
GLM 5	3.0	10.0	0.0%	0		4.98s	406	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.4	10.0	10.0	100.0%	0		5.32s	234	804
GLM 5	10.0	10.0	100.0%	0		5.78s	203	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.4	5.3	7.2	44.4%	1		74.27s	61	34,748
GLM 5	3.0	10.0	0.0%	0		2.24s	19	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.4	4.7	3.1	33.3%	1		4.92s	145	321
GLM 5	10.0	10.0	100.0%	0		3.27s	103	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.4	10.0	10.0	100.0%	0		3.11s	93	897
GLM 5	10.0	10.0	100.0%	0		1.48s	61	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.4	8.2	7.2	88.9%	1		9.13s	442	3,832
GLM 5	7.7	10.0	66.7%	0		2.05s	264	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.4	10.0	10.0	100.0%	0		13.28s	264	1,031
GLM 5	10.0	10.0	100.0%	0		11.07s	220	0

مقارنة سريعة

تبديل زوج المقارنة

Grok 4.1 FastmediumvsGLM 5none Nemotron 3 Supermediumمتاح مجانًاvsGLM 5none Gemini 3 Flash PreviewnonevsGPT-5.4medium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.4medium Mercury 2mediumvsGLM 5none Gemini 3.1 Flash Lite PreviewnonevsGPT-5.4medium Grok 4.20mediumvsGLM 5none Kimi K2.5mediumvsGLM 5none GPT-5 MinimediumvsGLM 5none GPT-5 NanomediumvsGLM 5none Gemini 3 Flash PreviewlowvsGPT-5.4medium GPT-5.4 MinimediumvsGLM 5none