قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-5.4 vs Z.ai: GLM 4.7 Flash

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-05

المقياس	OpenAI: GPT-5.4 none الإصدار: 2026-03-05	Z.ai: GLM 4.7 Flash medium الإصدار: 2026-01-19
الترتيب	#44	#52
متوسط الدرجة	4.6	3.3
اختبارات صحيحة
الاتساق	8.9	6.1
التكلفة لكل نتيجة	1.496	1.018
إجمالي التكلفة	$0.090	$0.041
معدل النجاح لكل محاولة	44.4%	44.4%
اختبارات غير مستقرة	2	7
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
رموز الإخراج	1,635	38,664
رموز الاستدلال	0	62,814
زمن الاستجابة (المتوسط)	1.46s	39.18s
زمن الاستجابة (الحد الأقصى)	2.89s	174.55s
زمن الاستجابة (الإجمالي)	21.86s	313.44s

أفضل النماذج حسب الدرجة

زمن الاستجابة (المتوسط)

الدرجة مقابل التكلفة الإجمالية

متوسط الدرجة vs زمن الاستجابة (المتوسط)

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0
Z.ai: GLM 4.7 Flash	4.0	4.5	55.6%	2		27.09s	1,085	5,597

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0
Z.ai: GLM 4.7 Flash	10.0	2.1	33.3%	1		65.57s	2,585	20,648

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0
Z.ai: GLM 4.7 Flash	5.0	10.0	50.0%	0		1.51s	584	2,755

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0
Z.ai: GLM 4.7 Flash	10.0	4.4	33.3%	2		174.55s	33,000	25,394

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0
Z.ai: GLM 4.7 Flash	5.0	5.8	66.7%	1		2.97s	388	2,181

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0
Z.ai: GLM 4.7 Flash	10.0	7.2	11.1%	1		12.90s	798	5,225

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0
Z.ai: GLM 4.7 Flash	10.0	10.0	100.0%	0		15.95s	224	1,014

مقارنة سريعة

تبديل زوج المقارنة

Mercury 2nonevsGLM 4.7 Flashmedium MiniMax M2.5mediumvsGPT-5.4none Qwen3 Coder NextnonevsGLM 4.7 Flashmedium Grok 4.1 FastnonevsGLM 4.7 Flashmedium Kimi K2.5nonevsGLM 4.7 Flashmedium MiMo-V2-FlashnonevsGLM 4.7 Flashmedium LFM2-24B-A2BnonevsGLM 4.7 Flashmedium GPT-4o-mininonevsGLM 4.7 Flashmedium Mercury 2mediumvsGPT-5.4none Trinity Large Preview (free)noneمتاح مجانًاvsGLM 4.7 Flashmedium GPT-5.4nonevsQwen3.5-35B-A3Bmedium GPT-5.4nonevsQwen3 Coder Nextmedium