AI BENCHY
قارن
❤️ Made by XCS

اسم النموذج

Z.ai: GLM 4.7 Flash

تم إنشاء نتائج المعايير من مجموعات اختبارات Aibenchy في : 19‏/02‏/2026

المقياس Z.ai: GLM 4.7 Flash
الترتيب#23
الشركةZ.ai
Score 3.25
الاتساق 8.75
التكلفة لكل نتيجة 0.0351
إجمالي التكلفة $0.00071
اختبارات صحيحة 2/12
معدل النجاح لكل محاولة 27.8%
اختبارات غير مستقرة 2
رموز الإخراج 399
رموز الاستدلال 0

تفصيل الفئات

الفئة اختبارات ناجحة بالكامل Score الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة درجة الاستدلال التكلفة
Anti-AI Tricks 0/2 1.00 10.00 0.0% 0 - $0.00003
Data parsing and extraction 0/2 0.50 5.81 33.3% 1 - $0.00050
Domain specific 2/3 7.00 10.00 66.7% 0 - $0.00005
Instructions following 0/2 4.00 6.84 33.3% 1 - $0.00006
Puzzle Solving 0/3 2.33 9.91 0.0% 0 - $0.00008

النماذج المقارنة

قارن Z.ai: GLM 4.7 Flash مع...

#22 · MoonshotAI

MoonshotAI: Kimi K2.5

بدون استدلال

Score: 3.42

الاتساق: 9.28

معدل النجاح لكل محاولة: 30.6%

اختبارات غير مستقرة: 1

التكلفة لكل نتيجة: 0.2049

اختبارات صحيحة: 3/12

إجمالي التكلفة: $0.00615

قارن

#24 · X Ai

xAI: Grok 4.1 Fast

بدون استدلال

Score: 3.25

الاتساق: 9.17

معدل النجاح لكل محاولة: 30.6%

اختبارات غير مستقرة: 1

التكلفة لكل نتيجة: 0.1074

اختبارات صحيحة: 3/12

إجمالي التكلفة: $0.00323

قارن

#21 · Xiaomi

Xiaomi: MiMo-V2-Flash

الاستدلال (medium)

Score: 3.92

الاتساق: 7.89

معدل النجاح لكل محاولة: 44.4%

اختبارات غير مستقرة: 3

التكلفة لكل نتيجة: 0.4829

اختبارات صحيحة: 4/12

إجمالي التكلفة: $0.01932

قارن

مقارنة سريعة

قارن Z.ai: GLM 4.7 Flash مع...