AI BENCHY Compare

OpenAI: GPT-5 Mini vs Z.ai: GLM 5.2

الملخص

مقارنة benchmark بين GPT-5 Mini و GLM 5.2: يتقدم GLM 5.2 في متوسط النتيجة بـ 8.7 مقابل 8.5. لدى GPT-5 Mini تكلفة benchmark أقل عند $0.159 مقابل $0.324. GLM 5.2 أسرع عند 23.28s مقابل 23.64s، مع معدلات نجاح 63.5% مقابل 84.1%.

النموذج الموصى به: GPT-5 Mini - Its score stays close to the best score here (8.5 vs 8.7), while costing about 2.0x less than GLM 5.2.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-17

المقياس	GPT-5 Mini GPT-5 Mini medium الإصدار: 2025-08-07	GLM 5.2 GLM 5.2 medium الإصدار: 2026-06-17

المقياس	GPT-5 Mini GPT-5 Mini medium الإصدار: 2025-08-07	GLM 5.2 GLM 5.2 medium الإصدار: 2026-06-17
النتيجة	8.5	8.7
الترتيب	#16	#14
الموثوقية	10.0	9.5
الاتساق	9.1	8.4
اختبارات صحيحة
معدل النجاح لكل محاولة	63.5%	84.1%
اختبارات غير مستقرة	2	4
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	1.319	2.159
إجمالي التكلفة	$0.159	$0.324
سعر الإدخال	$0.250 / 1M	$1.400 / 1M
سعر الإخراج	$2.000 / 1M	$4.400 / 1M
إجمالي رموز الإدخال	37,100	37,199
رموز الإخراج	6,801	12,261
رموز الاستدلال	67,690	49,500
زمن الاستجابة (المتوسط)	23.64s	23.28s
زمن الاستجابة (الحد الأقصى)	88.15s	101.36s
زمن الاستجابة (الإجمالي)	496.44s	488.94s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#16 GPT-5 Mini

medium

Cost: $0.007
Time: 42.9s
Tokens: 3,432 tok

#14 GLM 5.2

medium

Cost: $0.041
Time: 195.8s
Tokens: 9,287 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	7.1	7.6	66.7%	1		13.86s	606	1,715	6,378
GLM 5.2	10.0	10.0	100.0%	0		5.89s	639	497	2,634

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	10.0	10.0	100.0%	0		27.63s	7,302	658	17,152
GLM 5.2	8.2	7.2	88.9%	1		40.96s	7,317	1,475	17,123

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	14,118	754	11,520
GLM 5.2	10.0	10.0	100.0%	0		51.96s	12,696	458	4,531

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	10.0	10.0	100.0%	0		12.58s	7,140	453	3,200
GLM 5.2	10.0	10.0	100.0%	0		13.44s	7,149	348	2,345

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	3.6	7.2	22.2%	1		44.63s	515	293	14,016
GLM 5.2	4.1	4.4	44.5%	2		45.47s	551	8,188	11,606

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	4.5	10.0	0.0%	0		13.50s	477	349	1,856
GLM 5.2	10.0	10.0	100.0%	0		17.39s	498	54	1,842

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	10.0	10.0	100.0%	0		11.59s	660	310	3,968
GLM 5.2	9.9	10.0	100.0%	0		7.90s	678	94	1,518

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	5.6	9.8	33.3%	0		15.20s	642	1,622	6,144
GLM 5.2	8.2	7.2	88.9%	1		13.13s	672	536	4,822

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	5,445	487	1,600
GLM 5.2	10.0	10.0	100.0%	0		20.41s	6,861	230	550

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	3.0	10.0	0.0%	0		9.99s	195	160	1,856
GLM 5.2	3.0	10.0	0.0%	0		34.25s	138	381	2,529

مقارنة سريعة

تبديل زوج المقارنة

GPT-5.2 ChatnonevsGLM 5.2medium DeepSeek V4 FlashhighvsGPT-5 Minimedium DeepSeek V4 FlashhighvsGLM 5.2medium Gemini 3.5 FlashlowvsGLM 5.2medium GPT-5.5lowvsGLM 5.2medium Gemini 3.5 FlashlowvsGPT-5 Minimedium GPT-5 MinimediumvsStep 3.7 Flashlow DeepSeek V4 ProhighvsGPT-5 Minimedium Step 3.7 FlashlowvsGLM 5.2medium DeepSeek V4 ProhighvsGLM 5.2medium Gemini 3 Flash PreviewlowvsGPT-5 Minimedium GPT-5.3 ChatnonevsGLM 5.2medium