قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

Inception: Mercury 2 vs Z.ai: GLM 5

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-05

المقياس	Inception: Mercury 2 medium الإصدار: 2026-02-24	Z.ai: GLM 5 none الإصدار: 2026-02-12
الترتيب	#35	#32
متوسط الدرجة	54	58
الاتساق	83	100
التكلفة لكل نتيجة	0.622	0.219
إجمالي التكلفة	$0.044	$0.018
زمن الاستجابة (المتوسط)	2.47s	4.13s
زمن الاستجابة (الحد الأقصى)	14.63s	11.07s
زمن الاستجابة (الإجمالي)	34.56s	33.03s
اختبارات صحيحة
معدل النجاح لكل محاولة	57.8%	53.3%
اختبارات غير مستقرة	3	0
رموز الإخراج	3,571	1,445
رموز الاستدلال	45,379	0

أفضل النماذج حسب الدرجة

زمن الاستجابة (المتوسط)

الدرجة مقابل التكلفة الإجمالية

متوسط الدرجة vs زمن الاستجابة (المتوسط)

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Inception: Mercury 2	73	98	66.7%	0		1.30s	2,531	2,410
Z.ai: GLM 5	40	100	33.3%	0		3.39s	272	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Inception: Mercury 2	100	100	100.0%	0		3.28s	268	4,887
Z.ai: GLM 5	100	100	0.0%	0		4.98s	406	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Inception: Mercury 2	55	59	83.3%	1		1.11s	183	1,656
Z.ai: GLM 5	99	100	100.0%	0		5.78s	203	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Inception: Mercury 2	100	72	11.1%	1		6.48s	41	30,754
Z.ai: GLM 5	100	100	0.0%	0		2.24s	19	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Inception: Mercury 2	100	100	100.0%	0		1.07s	14	958
Z.ai: GLM 5	100	100	100.0%	0		1.48s	61	0

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Inception: Mercury 2	17	75	22.2%	1		934ms	354	2,758
Z.ai: GLM 5	70	100	66.7%	0		2.05s	264	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Inception: Mercury 2	100	100	100.0%	0		1.89s	180	1,956
Z.ai: GLM 5	100	100	100.0%	0		11.07s	220	0

مقارنة سريعة

تبديل زوج المقارنة

Qwen3.5-35B-A3BmediumvsGLM 5none GPT-5 NanomediumvsGLM 5none Gemini 2.5 FlashnonevsMercury 2medium DeepSeek V3.2nonevsMercury 2medium GPT-5 MinimediumvsGLM 5none Mercury 2mediumvsQwen3.5-122B-A10Bnone Mercury 2mediumvsQwen3.5-Flashnone Mercury 2mediumvsQwen3.5-27Bnone Claude Opus 4.6mediumvsGLM 5none Kimi K2.5mediumvsGLM 5none Grok 4.1 FastmediumvsGLM 5none gpt-oss-120bmediumمتاح مجانًاvsGLM 5none