AI BENCHY
قارن
❤️ Made by XCS

اسم النموذج

Xiaomi: MiMo-V2-Flash

تم إنشاء نتائج المعايير من مجموعات اختبارات Aibenchy في : 19‏/02‏/2026

المقياس Xiaomi: MiMo-V2-Flash
الترتيب#21
الشركةXiaomi
Score 3.92
الاتساق 7.89
التكلفة لكل نتيجة 0.4829
إجمالي التكلفة $0.01932
اختبارات صحيحة 4/12
معدل النجاح لكل محاولة 44.4%
اختبارات غير مستقرة 3
رموز الإخراج 10,095
رموز الاستدلال 63,833

تفصيل الفئات

الفئة اختبارات ناجحة بالكامل Score الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة درجة الاستدلال التكلفة
Anti-AI Tricks 1/2 5.50 10.00 50.0% 0 9.73 $0.00140
Data parsing and extraction 1/2 5.50 10.00 50.0% 0 7.00 $0.00029
Domain specific 1/3 4.00 7.21 55.6% 1 8.72 $0.01477
Instructions following 1/2 5.00 5.80 66.7% 1 9.33 $0.00035
Puzzle Solving 0/3 1.00 7.14 11.1% 1 8.06 $0.00254

النماذج المقارنة

قارن Xiaomi: MiMo-V2-Flash مع...

#20 · Z.ai

Z.ai: GLM 4.7 Flash

الاستدلال (medium)

Score: 3.92

الاتساق: 6.51

معدل النجاح لكل محاولة: 50.0%

اختبارات غير مستقرة: 5

التكلفة لكل نتيجة: 0.2253

اختبارات صحيحة: 4/12

إجمالي التكلفة: $0.00902

قارن

#22 · MoonshotAI

MoonshotAI: Kimi K2.5

بدون استدلال

Score: 3.42

الاتساق: 9.28

معدل النجاح لكل محاولة: 30.6%

اختبارات غير مستقرة: 1

التكلفة لكل نتيجة: 0.2049

اختبارات صحيحة: 3/12

إجمالي التكلفة: $0.00615

قارن

#19 · OpenAI

OpenAI: GPT-4o-mini

بدون استدلال

Score: 4.00

الاتساق: 9.98

معدل النجاح لكل محاولة: 25.0%

اختبارات غير مستقرة: 0

التكلفة لكل نتيجة: 0.0576

اختبارات صحيحة: 3/12

إجمالي التكلفة: $0.00173

قارن

مقارنة سريعة

قارن Xiaomi: MiMo-V2-Flash مع...