التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Inception: Mercury 2 vs Z.ai: GLM 5

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-05

المقياس Inception: Mercury 2 medium الإصدار: 2026-02-24 Z.ai: GLM 5 none الإصدار: 2026-02-12
الترتيب #35 #32
متوسط الدرجة 54 58
الاتساق 83 100
التكلفة لكل نتيجة 0.622 0.219
إجمالي التكلفة $0.044 $0.018
زمن الاستجابة (المتوسط) 2.47s 4.13s
زمن الاستجابة (الحد الأقصى) 14.63s 11.07s
زمن الاستجابة (الإجمالي) 34.56s 33.03s
اختبارات صحيحة
معدل النجاح لكل محاولة 57.8% 53.3%
اختبارات غير مستقرة 3 0
رموز الإخراج 3,571 1,445
رموز الاستدلال 45,379 0

أفضل النماذج حسب الدرجة

زمن الاستجابة (المتوسط)

الدرجة مقابل التكلفة الإجمالية

متوسط الدرجة vs زمن الاستجابة (المتوسط)

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Inception: Mercury 2 73 98 66.7% 0 1.30s 2,531 2,410
Z.ai: GLM 5 40 100 33.3% 0 3.39s 272 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Inception: Mercury 2 100 100 100.0% 0 3.28s 268 4,887
Z.ai: GLM 5 100 100 0.0% 0 4.98s 406 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Inception: Mercury 2 55 59 83.3% 1 1.11s 183 1,656
Z.ai: GLM 5 99 100 100.0% 0 5.78s 203 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Inception: Mercury 2 100 72 11.1% 1 6.48s 41 30,754
Z.ai: GLM 5 100 100 0.0% 0 2.24s 19 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Inception: Mercury 2 100 100 100.0% 0 1.07s 14 958
Z.ai: GLM 5 100 100 100.0% 0 1.48s 61 0
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Inception: Mercury 2 17 75 22.2% 1 934ms 354 2,758
Z.ai: GLM 5 70 100 66.7% 0 2.05s 264 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Inception: Mercury 2 100 100 100.0% 0 1.89s 180 1,956
Z.ai: GLM 5 100 100 100.0% 0 11.07s 220 0

مقارنة سريعة

تبديل زوج المقارنة