AI BENCHY Compare

OpenAI: GPT-5 Nano vs Z.ai: GLM 5.2

الملخص

مقارنة benchmark بين GPT-5 Nano و GLM 5.2: يتقدم GLM 5.2 في متوسط النتيجة بـ 7.1 مقابل 6.7. لدى GLM 5.2 تكلفة benchmark أقل عند $0.051 مقابل $0.081. GLM 5.2 أسرع عند 6.34s مقابل 42.51s، مع معدلات نجاح 57.1% مقابل 60.3%.

النموذج الموصى به: GLM 5.2 - It has the best score here (7.1), while costing about 1.6x less than GPT-5 Nano.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-02

المقياس	GPT-5 Nano GPT-5 Nano medium الإصدار: 2025-08-07	GLM 5.2 GLM 5.2 none الإصدار: 2026-06-17

المقياس	GPT-5 Nano GPT-5 Nano medium الإصدار: 2025-08-07	GLM 5.2 GLM 5.2 none الإصدار: 2026-06-17
النتيجة	6.7	7.1
الترتيب	#82	#63
الموثوقية	10.0	9.9
الاتساق	7.3	9.6
اختبارات صحيحة
معدل النجاح لكل محاولة	57.1%	60.3%
اختبارات غير مستقرة	7	1
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	0.897	0.628
إجمالي التكلفة	$0.081	$0.051
سعر الإدخال	$0.050 / 1M	$0.930 / 1M
سعر الإخراج	$0.400 / 1M	$3.000 / 1M
إجمالي رموز الإدخال	34,108	38,671
رموز الإخراج	5,464	4,817
رموز الاستدلال	192,064	0
زمن الاستجابة (المتوسط)	42.51s	6.34s
زمن الاستجابة (الحد الأقصى)	204.02s	20.69s
زمن الاستجابة (الإجمالي)	595.09s	133.19s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#82 GPT-5 Nano

medium

التكلفة: $0.006
الوقت: 108.5s
الرموز: 13,209 tok

#63 GLM 5.2

none

SVG غير صالح

التكلفة: $0.033
الوقت: 87.7s
الرموز: 7,455 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Nano	6.5	7.9	58.3%	1		25.50s	606	1,221	21,184
GLM 5.2	8.3	10.0	75.0%	0		3.70s	567	313	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Nano	7.0	7.7	55.6%	1		41.62s	7,305	740	41,152
GLM 5.2	3.7	9.5	0.0%	0		7.55s	7,263	1,958	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Nano	10.0	10.0	100.0%	0		65.96s	11,019	578	17,984
GLM 5.2	10.0	10.0	100.0%	0		20.69s	14,296	1,489	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Nano	3.7	1.7	50.0%	2		21.42s	7,140	453	10,560
GLM 5.2	10.0	10.0	100.0%	0		7.17s	7,113	204	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Nano	5.2	4.4	55.6%	2		204.02s	619	237	64,448
GLM 5.2	5.3	10.0	33.3%	0		6.50s	696	27	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Nano	4.1	10.0	0.0%	0		17.51s	477	202	4,608
GLM 5.2	6.1	3.1	66.7%	1		4.42s	480	82	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Nano	9.8	10.0	100.0%	0		15.64s	660	312	4,736
GLM 5.2	9.8	10.0	100.0%	0		3.84s	642	66	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Nano	5.3	7.2	44.4%	1		20.63s	642	929	14,272
GLM 5.2	7.7	10.0	66.7%	0		3.31s	618	265	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Nano	10.0	10.0	100.0%	0		33.30s	5,445	558	6,976
GLM 5.2	10.0	10.0	100.0%	0		15.76s	6,807	400	0

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Nano	3.0	10.0	0.0%	0		20.13s	195	234	6,144
GLM 5.2	3.0	10.0	0.0%	0		3.41s	189	13	0

مقارنة سريعة

تبديل زوج المقارنة

Gemma 4 26B A4Bmediumمتاح مجانًاvsGLM 5.2none Step 3.7 FlashhighvsGLM 5.2none Laguna XS 2.1mediumمتاح مجانًاvsGLM 5.2none Kimi K2.7 CodemediumvsGLM 5.2none Gemini 3.1 Flash Lite PreviewlowvsGPT-5 Nanomedium Gemini 3.5 FlashminimalvsGPT-5 Nanomedium GPT-5 NanomediumvsQwen3.7 Maxnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5 Nanomedium Grok 4.20mediumvsGLM 5.2none Gemini 3.1 Flash LitelowvsGPT-5 Nanomedium Gemini 3 Flash PreviewlowvsGLM 5.2none Gemini 3 Flash PreviewnonevsGPT-5 Nanomedium