AI BENCHY
قارن
❤️ Made by XCS

اسم النموذج

MiniMax: MiniMax M2.5

تم إنشاء نتائج المعايير من مجموعات اختبارات Aibenchy في : 19‏/02‏/2026

المقياس MiniMax: MiniMax M2.5
الترتيب#17
الشركةMiniMax
Score 5.08
الاتساق 6.00
التكلفة لكل نتيجة 4.0276
إجمالي التكلفة $0.20138
اختبارات صحيحة 5/12
معدل النجاح لكل محاولة 61.1%
اختبارات غير مستقرة 6
رموز الإخراج 121,028
رموز الاستدلال 165,110

تفصيل الفئات

الفئة اختبارات ناجحة بالكامل Score الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة درجة الاستدلال التكلفة
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 7.58 $0.00902
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 9.45 $0.00774
Domain specific 0/3 1.00 4.41 22.2% 2 6.06 $0.16952
Instructions following 1/2 7.00 6.41 66.7% 1 8.33 $0.00307
Puzzle Solving 1/3 4.33 4.79 55.5% 2 8.28 $0.01205

النماذج المقارنة

قارن MiniMax: MiniMax M2.5 مع...

#16 · Anthropic

Anthropic: Claude Opus 4.6

الاستدلال (medium)

Score: 5.42

الاتساق: 8.60

معدل النجاح لكل محاولة: 55.5%

اختبارات غير مستقرة: 2

التكلفة لكل نتيجة: 12.8695

اختبارات صحيحة: 6/12

إجمالي التكلفة: $0.77217

قارن

#18 · Stepfun

StepFun: Step 3.5 Flash

الاستدلال (medium)

Score: 4.92

الاتساق: 7.34

معدل النجاح لكل محاولة: 58.3%

اختبارات غير مستقرة: 4

التكلفة لكل نتيجة: 0.0000

اختبارات صحيحة: 5/12

إجمالي التكلفة: $0.00000

قارن

#15 · Z.ai

Z.ai: GLM 5

بدون استدلال

Score: 5.42

الاتساق: 10.00

معدل النجاح لكل محاولة: 50.0%

اختبارات غير مستقرة: 0

التكلفة لكل نتيجة: 0.0704

اختبارات صحيحة: 6/12

إجمالي التكلفة: $0.00423

قارن

مقارنة سريعة

قارن MiniMax: MiniMax M2.5 مع...