AI BENCHY
قارن
❤️ Made by XCS

اسم النموذج

Z.ai: GLM 4.7 Flash

تم إنشاء نتائج المعايير من مجموعات اختبارات Aibenchy في : 19‏/02‏/2026

المقياس Z.ai: GLM 4.7 Flash
الترتيب#20
الشركةZ.ai
Score 3.92
الاتساق 6.51
التكلفة لكل نتيجة 0.2253
إجمالي التكلفة $0.00902
اختبارات صحيحة 4/12
معدل النجاح لكل محاولة 50.0%
اختبارات غير مستقرة 5
رموز الإخراج 7,601
رموز الاستدلال 18,390

تفصيل الفئات

الفئة اختبارات ناجحة بالكامل Score الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة درجة الاستدلال التكلفة
Anti-AI Tricks 1/2 5.50 5.81 66.7% 1 9.08 $0.00131
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.87 $0.00281
Domain specific 0/3 1.00 4.41 33.3% 2 8.21 $0.00183
Instructions following 1/2 5.00 5.81 66.7% 1 9.50 $0.00105
Puzzle Solving 0/3 1.00 7.20 11.1% 1 7.33 $0.00203

النماذج المقارنة

قارن Z.ai: GLM 4.7 Flash مع...

#19 · OpenAI

OpenAI: GPT-4o-mini

بدون استدلال

Score: 4.00

الاتساق: 9.98

معدل النجاح لكل محاولة: 25.0%

اختبارات غير مستقرة: 0

التكلفة لكل نتيجة: 0.0576

اختبارات صحيحة: 3/12

إجمالي التكلفة: $0.00173

قارن

#21 · Xiaomi

Xiaomi: MiMo-V2-Flash

الاستدلال (medium)

Score: 3.92

الاتساق: 7.89

معدل النجاح لكل محاولة: 44.4%

اختبارات غير مستقرة: 3

التكلفة لكل نتيجة: 0.4829

اختبارات صحيحة: 4/12

إجمالي التكلفة: $0.01932

قارن

#18 · Stepfun

StepFun: Step 3.5 Flash

الاستدلال (medium)

Score: 4.92

الاتساق: 7.34

معدل النجاح لكل محاولة: 58.3%

اختبارات غير مستقرة: 4

التكلفة لكل نتيجة: 0.0000

اختبارات صحيحة: 5/12

إجمالي التكلفة: $0.00000

قارن

مقارنة سريعة

قارن Z.ai: GLM 4.7 Flash مع...