AI BENCHY Compare

OpenAI: GPT-5 Mini vs Z.ai: GLM 5

الملخص

مقارنة benchmark بين GPT-5 Mini و GLM 5: متوسط النتيجة متقارب جدًا عند 8.5 مقابل 8.6. لدى GPT-5 Mini تكلفة benchmark أقل عند $0.159 مقابل $0.228. GPT-5 Mini أسرع عند 23.64s مقابل 33.54s، مع معدلات نجاح 63.5% مقابل 82.5%.

النموذج الموصى به: GPT-5 Mini - It has the strongest score in this comparison (8.5) and the best overall balance of cost and response time across all 2 models.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-02

المقياس	GPT-5 Mini GPT-5 Mini medium الإصدار: 2025-08-07	GLM 5 GLM 5 medium الإصدار: 2026-02-12

المقياس	GPT-5 Mini GPT-5 Mini medium الإصدار: 2025-08-07	GLM 5 GLM 5 medium الإصدار: 2026-02-12
النتيجة	8.5	8.6
الترتيب	#16	#15
الموثوقية	10.0	10.0
الاتساق	9.1	8.5
اختبارات صحيحة
معدل النجاح لكل محاولة	63.5%	82.5%
اختبارات غير مستقرة	2	4
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	1.319	1.668
إجمالي التكلفة	$0.159	$0.228
سعر الإدخال	$0.250 / 1M	$0.600 / 1M
سعر الإخراج	$2.000 / 1M	$1.920 / 1M
إجمالي رموز الإدخال	37,100	35,224
رموز الإخراج	6,801	21,570
رموز الاستدلال	67,690	102,996
زمن الاستجابة (المتوسط)	23.64s	33.54s
زمن الاستجابة (الحد الأقصى)	88.15s	99.85s
زمن الاستجابة (الإجمالي)	496.44s	435.99s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#16 GPT-5 Mini

medium

التكلفة: $0.007
الوقت: 42.9s
الرموز: 3,432 tok

#15 GLM 5

medium

التكلفة: $0.005
الوقت: 20.7s
الرموز: 2,068 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	7.1	7.6	66.7%	1		13.86s	606	1,715	6,378
GLM 5	10.0	10.0	100.0%	0		23.66s	555	480	7,056

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	10.0	10.0	100.0%	0		27.63s	7,302	658	17,152
GLM 5	10.0	10.0	100.0%	0		74.30s	7,254	2,997	52,930

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	14,118	754	11,520
GLM 5	10.0	10.0	100.0%	0		28.96s	12,804	662	3,242

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	10.0	10.0	100.0%	0		12.58s	7,140	453	3,200
GLM 5	7.1	5.6	83.3%	1		8.90s	5,508	567	3,734

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	3.6	7.2	22.2%	1		44.63s	515	293	14,016
GLM 5	3.5	4.4	33.3%	2		0ms	260	13,176	14,137

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	4.5	10.0	0.0%	0		13.50s	477	349	1,856
GLM 5	6.1	3.1	66.7%	1		14.69s	477	2,020	2,248

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	10.0	10.0	100.0%	0		11.59s	660	310	3,968
GLM 5	10.0	10.0	100.0%	0		7.25s	636	1,001	2,129

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	5.6	9.8	33.3%	0		15.20s	642	1,622	6,144
GLM 5	10.0	10.0	100.0%	0		11.33s	609	33	4,076

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	5,445	487	1,600
GLM 5	10.0	10.0	100.0%	0		15.93s	6,935	233	994

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	3.0	10.0	0.0%	0		9.99s	195	160	1,856
GLM 5	3.0	10.0	0.0%	0		67.37s	186	401	12,450

مقارنة سريعة

تبديل زوج المقارنة

GPT-5.2 ChatnonevsGLM 5medium DeepSeek V4 FlashhighvsGPT-5 Minimedium DeepSeek V4 FlashhighvsGLM 5medium Gemini 3.5 FlashlowvsGLM 5medium Gemini 3.5 FlashlowvsGPT-5 Minimedium GPT-5.5lowvsGLM 5medium Claude Opus 4.8lowvsGPT-5 Minimedium Claude Opus 4.8lowvsGLM 5medium GPT-5 MinimediumvsStep 3.7 Flashlow Step 3.7 FlashlowvsGLM 5medium DeepSeek V4 ProhighvsGPT-5 Minimedium DeepSeek V4 ProhighvsGLM 5medium