قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-5 Mini vs Z.ai: GLM 4.7 Flash

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-05

المقياس	OpenAI: GPT-5 Mini medium الإصدار: 2025-08-07	Z.ai: GLM 4.7 Flash none الإصدار: 2026-01-19
الترتيب	#31	#47
متوسط الدرجة	6.1	3.9
اختبارات صحيحة
الاتساق	8.9	8.3
التكلفة لكل نتيجة	1.401	0.064
إجمالي التكلفة	$0.113	$0.003
معدل النجاح لكل محاولة	62.2%	37.8%
اختبارات غير مستقرة	2	3
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
رموز الإخراج	5,477	1,721
رموز الاستدلال	46,912	0
زمن الاستجابة (المتوسط)	25.92s	3.16s
زمن الاستجابة (الحد الأقصى)	88.15s	7.05s
زمن الاستجابة (الإجمالي)	388.79s	25.31s

أفضل النماذج حسب الدرجة

زمن الاستجابة (المتوسط)

الدرجة مقابل التكلفة الإجمالية

متوسط الدرجة vs زمن الاستجابة (المتوسط)

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	7.0	9.6	66.7%	0		16.45s	1,645	5,824
Z.ai: GLM 4.7 Flash	10.0	7.2	22.2%	1		6.59s	430	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	754	11,520
Z.ai: GLM 4.7 Flash	10.0	10.0	0.0%	0		3.22s	704	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	9.9	10.0	100.0%	0		12.58s	453	3,200
Z.ai: GLM 4.7 Flash	5.4	5.8	83.3%	1		4.82s	196	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	10.0	7.2	22.2%	1		44.63s	293	14,016
Z.ai: GLM 4.7 Flash	7.0	10.0	66.7%	0		744ms	19	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	7.5	6.6	83.3%	1		15.66s	318	4,992
Z.ai: GLM 4.7 Flash	5.5	10.0	50.0%	0		888ms	62	0

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	4.3	9.8	33.3%	0		14.09s	1,527	5,760
Z.ai: GLM 4.7 Flash	3.7	10.0	0.0%	0		1.00s	98	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	487	1,600
Z.ai: GLM 4.7 Flash	10.0	1.6	33.3%	1		7.05s	212	0

مقارنة سريعة

تبديل زوج المقارنة

GPT-5 MinimediumvsGLM 5none GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none Qwen3 Coder NextmediumvsGLM 4.7 Flashnone Claude Sonnet 4.6nonevsGPT-5 Minimedium Gemini 2.5 FlashnonevsGPT-5 Minimedium DeepSeek V3.2nonevsGPT-5 Minimedium MiniMax M2.5mediumvsGLM 4.7 Flashnone Gemini 3 Flash PreviewnonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-122B-A10Bnone GPT-5 MinimediumvsQwen3.5-Flashnone GPT-5 MinimediumvsQwen3.5-27Bnone gpt-oss-120bmediumمتاح مجانًاvsGLM 4.7 Flashnone