AI BENCHY Compare

OpenAI: GPT-5.5 vs Z.ai: GLM 5

الملخص

مقارنة benchmark بين GPT-5.5 و GLM 5: يتقدم GPT-5.5 في متوسط النتيجة بـ 6.3 مقابل 6.0. لدى GLM 5 تكلفة benchmark أقل عند $0.027 مقابل $0.231. GPT-5.5 أسرع عند 1.89s مقابل 4.03s، مع معدلات نجاح 54.0% مقابل 44.4%.

النموذج الموصى به: GLM 5 - Its score stays close to the best score here (6.0 vs 6.3), while costing about 8.8x less than GPT-5.5.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-02

المقياس	GPT-5.5 GPT-5.5 none الإصدار: 2026-04-24	GLM 5 GLM 5 none الإصدار: 2026-02-12

المقياس	GPT-5.5 GPT-5.5 none الإصدار: 2026-04-24	GLM 5 GLM 5 none الإصدار: 2026-02-12
النتيجة	6.3	6.0
الترتيب	#93	#104
الموثوقية	10.0	10.0
الاتساق	8.8	9.7
اختبارات صحيحة
معدل النجاح لكل محاولة	54.0%	44.4%
اختبارات غير مستقرة	3	1
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	2.302	0.263
إجمالي التكلفة	$0.231	$0.027
سعر الإدخال	$5.000 / 1M	$0.600 / 1M
سعر الإخراج	$30.000 / 1M	$1.920 / 1M
إجمالي رموز الإدخال	34,212	37,135
رموز الإخراج	1,971	1,989
رموز الاستدلال	0	0
زمن الاستجابة (المتوسط)	1.89s	4.03s
زمن الاستجابة (الحد الأقصى)	5.56s	11.07s
زمن الاستجابة (الإجمالي)	39.64s	56.37s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#93 GPT-5.5

none

التكلفة: $0.090
الوقت: 54.3s
الرموز: 3,063 tok

#104 GLM 5

none

التكلفة: $0.007
الوقت: 32.1s
الرموز: 2,023 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	6.9	7.9	66.7%	1		1.31s	606	213	0
GLM 5	4.8	10.0	25.0%	0		2.37s	510	275	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	5.5	10.0	33.3%	0		1.35s	7,305	462	0
GLM 5	4.0	7.8	11.1%	1		5.12s	7,256	428	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	3.0	10.0	0.0%	0		5.56s	11,019	300	0
GLM 5	3.0	10.0	0.0%	0		4.98s	12,812	406	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		1.18s	7,140	222	0
GLM 5	10.0	10.0	100.0%	0		5.78s	7,107	203	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	2.9	7.2	11.1%	1		1.31s	723	52	0
GLM 5	3.0	10.0	0.0%	0		2.24s	643	19	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		3.41s	477	124	0
GLM 5	10.0	10.0	100.0%	0		3.27s	477	103	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	6.2	5.8	66.7%	1		1.15s	660	81	0
GLM 5	10.0	10.0	100.0%	0		1.48s	636	61	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	7.7	10.0	66.7%	0		1.29s	642	252	0
GLM 5	7.7	10.0	66.7%	0		1.91s	609	261	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		3.90s	5,445	247	0
GLM 5	10.0	10.0	100.0%	0		11.07s	6,899	220	0

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	3.0	10.0	0.0%	0		5.01s	195	18	0
GLM 5	3.0	10.0	0.0%	0		3.62s	186	13	0

مقارنة سريعة

تبديل زوج المقارنة

GPT-5.5nonevsQwen3.5-35B-A3Bmedium Gemma 4 31Bmediumمتاح مجانًاvsGPT-5.5none Nemotron 3 Supermediumمتاح مجانًاvsGPT-5.5none North Mini Codemediumمتاح مجانًاvsGLM 5none Gemini 3.1 Flash LiteminimalvsGPT-5.5none Gemini 3.1 Flash LitelowvsGPT-5.5none Gemini 3.1 Flash LiteminimalvsGLM 5none Gemini 3.1 Flash Lite PreviewlowvsGPT-5.5none GPT-5.5nonevsQwen3.6 27Bmedium Qwen3.5-35B-A3BmediumvsGLM 5none GPT-5.5nonevsStep 3.5 Flashmedium Gemma 4 31Bmediumمتاح مجانًاvsGLM 5none