التنقل
AI BENCHY
Your ad here

AI BENCHY Compare

Mistral: Mistral Small 4 vs Z.ai: GLM 4.7 Flash

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-17

المقياس Mistral Small 4 Mistral Small 4 none الإصدار: 2026-03-16 GLM 4.7 Flash GLM 4.7 Flash medium الإصدار: 2026-01-19
الترتيب #61 #69
النتيجة 5.3 4.7
الاتساق 9.5 6.6
التكلفة لكل نتيجة 0.108 1.046
إجمالي التكلفة $0.006 $0.042
اختبارات صحيحة
معدل النجاح لكل محاولة 33.3% 39.2%
اختبارات غير مستقرة 1 7
إجمالي مرات التشغيل 51 51
رموز الإخراج 1,624 38,719
رموز الاستدلال 0 65,465
زمن الاستجابة (المتوسط) 629ms 33.44s
زمن الاستجابة (الحد الأقصى) 1.72s 174.55s
زمن الاستجابة (الإجمالي) 10.70s 334.39s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 3.4 7.9 16.7% 1 395ms 182 0
GLM 4.7 Flash 4.7 5.9 41.7% 2 14.95s 1,122 6,110
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 496 0
GLM 4.7 Flash 2.8 2.1 33.3% 1 65.57s 2,585 20,648
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 10.0 10.0 100.0% 0 822ms 261 0
GLM 4.7 Flash 6.3 10.0 50.0% 0 1.51s 584 2,755
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 5.3 10.0 33.3% 0 367ms 28 0
GLM 4.7 Flash 3.5 4.4 33.3% 2 174.55s 33,000 25,394
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 4.0 10.0 0.0% 0 729ms 205 0
GLM 4.7 Flash 3.6 9.7 0.0% 0 18.14s 18 2,138
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 6.5 10.0 50.0% 0 380ms 69 0
GLM 4.7 Flash 6.2 5.8 66.7% 1 2.97s 388 2,181
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 3.1 9.9 0.0% 0 589ms 170 0
GLM 4.7 Flash 2.9 7.2 11.1% 1 12.90s 798 5,225
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 213 0
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 224 1,014

مقارنة سريعة

تبديل زوج المقارنة