AI BENCHY
قارن
❤️ Made by XCS
Your ad here

اسم النموذج

MoonshotAI: Kimi K2.5

بدون استدلال

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في : 24‏/02‏/2026

المقياس MoonshotAI: Kimi K2.5
الترتيب#24
الشركةMoonshotAI
Score 3.62
الاتساق 8.84
التكلفة لكل نتيجة 0.2413
إجمالي التكلفة $0.00725
اختبارات صحيحة
معدل النجاح لكل محاولة 30.8%
اختبارات غير مستقرة 2
رموز الإخراج 1,695
رموز الاستدلال 0
زمن الاستجابة (المتوسط)11378ms
زمن الاستجابة (الإجمالي)11378ms
زمن الاستجابة (الحد الأقصى)11378ms

تفصيل الفئات

الفئة اختبارات ناجحة بالكامل Score الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة درجة الاستدلال زمن الاستجابة (المتوسط) التكلفة
حيل مضادة للذكاء الاصطناعي 2.67 7.86 11.1% 1 - 11378ms $0.00121
تحليل البيانات واستخراجها 5.50 5.81 83.3% 1 - 0ms $0.00455
خاص بالمجال 4.00 10.00 33.3% 0 - 0ms $0.00027
اتباع التعليمات 5.00 9.99 50.0% 0 - 0ms $0.00035
Puzzle Solving 2.00 9.92 0.0% 0 - 0ms $0.00090

النماذج المقارنة

قارن MoonshotAI: Kimi K2.5 مع...

#23 · Z.ai

Z.ai: GLM 4.7 Flash

الاستدلال (medium)

Score: 3.69

الاتساق: 6.15

معدل النجاح لكل محاولة: 48.7%

اختبارات غير مستقرة: 6

التكلفة لكل نتيجة: 0.2600

اختبارات صحيحة:

إجمالي التكلفة: $0.01041

قارن

#25 · X Ai

xAI: Grok 4.1 Fast

بدون استدلال

Score: 3.15

الاتساق: 9.24

معدل النجاح لكل محاولة: 28.2%

اختبارات غير مستقرة: 1

التكلفة لكل نتيجة: 0.1153

اختبارات صحيحة:

إجمالي التكلفة: $0.00346

قارن

#22 · Xiaomi

Xiaomi: MiMo-V2-Flash

الاستدلال (medium)

Score: 3.77

الاتساق: 7.46

معدل النجاح لكل محاولة: 43.6%

اختبارات غير مستقرة: 4

التكلفة لكل نتيجة: 0.5072

اختبارات صحيحة:

إجمالي التكلفة: $0.02029

قارن

مقارنة سريعة

قارن MoonshotAI: Kimi K2.5 مع...