التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs Z.ai: GLM 4.7 Flash

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-05

المقياس Inception: Mercury 2 medium الإصدار: 2026-02-24 Z.ai: GLM 4.7 Flash none الإصدار: 2026-01-19
الترتيب #35 #47
متوسط الدرجة 54 39
الاتساق 83 83
التكلفة لكل نتيجة 0.622 0.064
إجمالي التكلفة $0.044 $0.003
زمن الاستجابة (المتوسط) 2.47s 3.16s
زمن الاستجابة (الحد الأقصى) 14.63s 7.05s
زمن الاستجابة (الإجمالي) 34.56s 25.31s
اختبارات صحيحة
معدل النجاح لكل محاولة 57.8% 37.8%
اختبارات غير مستقرة 3 3
رموز الإخراج 3,571 1,721
رموز الاستدلال 45,379 0

أفضل النماذج حسب الدرجة

زمن الاستجابة (المتوسط)

الدرجة مقابل التكلفة الإجمالية

متوسط الدرجة vs زمن الاستجابة (المتوسط)

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Inception: Mercury 2 73 98 66.7% 0 1.30s 2,531 2,410
Z.ai: GLM 4.7 Flash 100 72 22.2% 1 6.59s 430 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Inception: Mercury 2 100 100 100.0% 0 3.28s 268 4,887
Z.ai: GLM 4.7 Flash 100 100 0.0% 0 3.22s 704 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Inception: Mercury 2 55 59 83.3% 1 1.11s 183 1,656
Z.ai: GLM 4.7 Flash 54 58 83.3% 1 4.82s 196 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Inception: Mercury 2 100 72 11.1% 1 6.48s 41 30,754
Z.ai: GLM 4.7 Flash 70 100 66.7% 0 744ms 19 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Inception: Mercury 2 100 100 100.0% 0 1.07s 14 958
Z.ai: GLM 4.7 Flash 55 100 50.0% 0 888ms 62 0
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Inception: Mercury 2 17 75 22.2% 1 934ms 354 2,758
Z.ai: GLM 4.7 Flash 37 100 0.0% 0 1.00s 98 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Inception: Mercury 2 100 100 100.0% 0 1.89s 180 1,956
Z.ai: GLM 4.7 Flash 100 16 33.3% 1 7.05s 212 0

مقارنة سريعة

تبديل زوج المقارنة