AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs Z.ai: GLM 5.2

الملخص

مقارنة benchmark بين GPT-5.3 Chat و GLM 5.2: يتقدم GLM 5.2 في متوسط النتيجة بـ 8.7 مقابل 7.5. لدى GLM 5.2 تكلفة benchmark أقل عند $0.324 مقابل $0.433. GPT-5.3 Chat أسرع عند 6.34s مقابل 23.28s، مع معدلات نجاح 66.7% مقابل 84.1%.

النموذج الموصى به: GLM 5.2 - It has the strongest score in this comparison (8.7) and the best overall balance of cost and response time across all 2 models.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-17

المقياس	GPT-5.3 Chat GPT-5.3 Chat none الإصدار: 2026-03-03	GLM 5.2 GLM 5.2 medium الإصدار: 2026-06-17

المقياس	GPT-5.3 Chat GPT-5.3 Chat none الإصدار: 2026-03-03	GLM 5.2 GLM 5.2 medium الإصدار: 2026-06-17
النتيجة	7.5	8.7
الترتيب	#45	#14
الموثوقية	10.0	9.5
الاتساق	8.1	8.4
اختبارات صحيحة
معدل النجاح لكل محاولة	66.7%	84.1%
اختبارات غير مستقرة	5	4
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	3.605	2.159
إجمالي التكلفة	$0.433	$0.324
سعر الإدخال	$1.750 / 1M	$1.400 / 1M
سعر الإخراج	$14.000 / 1M	$4.400 / 1M
إجمالي رموز الإدخال	34,209	37,199
رموز الإخراج	26,617	12,261
رموز الاستدلال	0	49,500
زمن الاستجابة (المتوسط)	6.34s	23.28s
زمن الاستجابة (الحد الأقصى)	18.33s	101.36s
زمن الاستجابة (الإجمالي)	133.13s	488.94s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#45 GPT-5.3 Chat

none

Cost: $0.008
Time: 8.1s
Tokens: 634 tok

#14 GLM 5.2

medium

Cost: $0.041
Time: 195.8s
Tokens: 9,287 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.3 Chat	6.7	8.1	58.3%	1		3.86s	606	3,167	0
GLM 5.2	10.0	10.0	100.0%	0		5.89s	639	497	2,634

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.3 Chat	5.6	4.7	55.6%	2		10.52s	7,302	6,632	0
GLM 5.2	8.2	7.2	88.9%	1		40.96s	7,317	1,475	17,123

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.3 Chat	10.0	10.0	100.0%	0		11.96s	11,019	2,614	0
GLM 5.2	10.0	10.0	100.0%	0		51.96s	12,696	458	4,531

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.21s	7,140	942	0
GLM 5.2	10.0	10.0	100.0%	0		13.44s	7,149	348	2,345

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.3 Chat	3.5	4.4	33.3%	2		13.01s	723	8,264	0
GLM 5.2	4.1	4.4	44.5%	2		45.47s	551	8,188	11,606

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.3 Chat	4.6	10.0	0.0%	0		1.99s	477	319	0
GLM 5.2	10.0	10.0	100.0%	0		17.39s	498	54	1,842

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.3 Chat	9.8	10.0	100.0%	0		3.51s	660	1,491	0
GLM 5.2	9.9	10.0	100.0%	0		7.90s	678	94	1,518

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.99s	642	1,758	0
GLM 5.2	8.2	7.2	88.9%	1		13.13s	672	536	4,822

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.3 Chat	10.0	10.0	100.0%	0		8.36s	5,445	861	0
GLM 5.2	10.0	10.0	100.0%	0		20.41s	6,861	230	550

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.3 Chat	3.0	10.0	0.0%	0		4.38s	195	569	0
GLM 5.2	3.0	10.0	0.0%	0		34.25s	138	381	2,529

مقارنة سريعة

تبديل زوج المقارنة

Mercury 2mediumvsGPT-5.3 Chatnone Kimi K2.5mediumvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.6 Flashmedium DeepSeek V3.2mediumvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsGrok Build 0.1medium DeepSeek V4 ProhighvsGPT-5.3 Chatnone Seed-2.0-MinimediumvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsMiMo-V2.5-Promedium MiniMax M3mediumvsGPT-5.3 Chatnone Gemini 3 Flash PreviewlowvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsGrok 4.20medium GPT-5.2 ChatnonevsGLM 5.2medium