AI BENCHY Compare

OpenAI: GPT-5.4 vs Z.ai: GLM 5

الملخص

مقارنة benchmark بين GPT-5.4 و GLM 5: يتقدم GLM 5 في متوسط النتيجة بـ 6.0 مقابل 5.8. لدى GLM 5 تكلفة benchmark أقل عند $0.027 مقابل $0.122. GPT-5.4 أسرع عند 1.42s مقابل 4.03s، مع معدلات نجاح 36.5% مقابل 44.4%.

النموذج الموصى به: GLM 5 - It has the best score here (6.0), while costing about 4.7x less than GPT-5.4.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس	GPT-5.4 GPT-5.4 none الإصدار: 2026-03-05	GLM 5 GLM 5 none الإصدار: 2026-02-12

المقياس	GPT-5.4 GPT-5.4 none الإصدار: 2026-03-05	GLM 5 GLM 5 none الإصدار: 2026-02-12
النتيجة	5.8	6.0
الترتيب	#112	#101
الموثوقية	10.0	10.0
الاتساق	9.2	9.7
اختبارات صحيحة
معدل النجاح لكل محاولة	36.5%	44.4%
اختبارات غير مستقرة	2	1
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	1.740	0.263
إجمالي التكلفة	$0.122	$0.027
سعر الإدخال	$2.500 / 1M	$0.600 / 1M
سعر الإخراج	$15.000 / 1M	$1.920 / 1M
إجمالي رموز الإدخال	34,212	37,135
رموز الإخراج	2,417	1,989
رموز الاستدلال	0	0
زمن الاستجابة (المتوسط)	1.42s	4.03s
زمن الاستجابة (الحد الأقصى)	2.95s	11.07s
زمن الاستجابة (الإجمالي)	29.87s	56.37s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#112 GPT-5.4

none

التكلفة: $0.026
الوقت: 18.1s
الرموز: 1,792 tok

#101 GLM 5

none

التكلفة: $0.007
الوقت: 32.1s
الرموز: 2,023 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4	3.2	8.0	8.3%	1		1.21s	606	406	0
GLM 5	4.8	10.0	25.0%	0		2.37s	510	275	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4	5.5	10.0	33.3%	0		1.62s	7,305	516	0
GLM 5	4.0	7.8	11.1%	1		5.12s	7,256	428	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4	3.0	10.0	0.0%	0		2.89s	11,019	291	0
GLM 5	3.0	10.0	0.0%	0		4.98s	12,812	406	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4	10.0	10.0	100.0%	0		1.04s	7,140	222	0
GLM 5	10.0	10.0	100.0%	0		5.78s	7,107	203	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4	5.3	7.2	44.4%	1		1.07s	723	50	0
GLM 5	3.0	10.0	0.0%	0		2.24s	643	19	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4	4.4	9.9	0.0%	0		1.78s	477	184	0
GLM 5	10.0	10.0	100.0%	0		3.27s	477	103	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4	6.5	10.0	50.0%	0		1.07s	660	81	0
GLM 5	10.0	10.0	100.0%	0		1.48s	636	61	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4	5.6	9.8	33.3%	0		1.44s	642	381	0
GLM 5	7.7	10.0	66.7%	0		1.91s	609	261	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4	10.0	10.0	100.0%	0		2.75s	5,445	246	0
GLM 5	10.0	10.0	100.0%	0		11.07s	6,899	220	0

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4	3.0	10.0	0.0%	0		990ms	195	40	0
GLM 5	3.0	10.0	0.0%	0		3.62s	186	13	0

مقارنة سريعة

تبديل زوج المقارنة

North Mini Codemediumمتاح مجانًاvsGPT-5.4none North Mini Codemediumمتاح مجانًاvsGLM 5none Gemini 3.1 Flash LiteminimalvsGLM 5none Qwen3.5-35B-A3BmediumvsGLM 5none Gemma 4 31Bmediumمتاح مجانًاvsGLM 5none Gemini 3.1 Flash LiteminimalvsGPT-5.4none Nemotron 3 Supermediumمتاح مجانًاvsGLM 5none Gemini 3.1 Flash LitelowvsGLM 5none GPT-5.4nonevsQwen3.5-35B-A3Bmedium Gemini 3.1 Flash Lite PreviewlowvsGLM 5none Gemma 4 31Bmediumمتاح مجانًاvsGPT-5.4none Nemotron 3 Supermediumمتاح مجانًاvsGPT-5.4none