التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs MiniMax: MiniMax M2.5

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-01

المقياس DeepSeek V3.2 DeepSeek V3.2 none الإصدار: 2025-12-01 MiniMax M2.5 MiniMax M2.5 medium الإصدار: 2026-02-12
النتيجة 5.6 5.5
الترتيب #120 #124
الموثوقية 10.0 10.0
الاتساق 8.3 6.4
اختبارات صحيحة
معدل النجاح لكل محاولة 41.7% 48.3%
اختبارات غير مستقرة 6 9
إجمالي مرات التشغيل 60 60
التكلفة لكل نتيجة 0.222 6.075
إجمالي التكلفة $0.018 $0.294
سعر الإدخال $0.252 / 1M $0.150 / 1M
سعر الإخراج $0.378 / 1M $1.150 / 1M
رموز الإخراج 11,159 109,492
رموز الاستدلال 0 251,674
زمن الاستجابة (المتوسط) 14.43s 49.87s
زمن الاستجابة (الحد الأقصى) 115.89s 237.27s
زمن الاستجابة (الإجمالي) 288.55s 598.39s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 3.2 8.2 8.3% 1 9.35s 1,073 0
MiniMax M2.5 7.9 6.3 83.3% 2 20.82s 286 45,344
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 3.1 5.4 16.7% 1 20.87s 4,522 0
MiniMax M2.5 3.5 9.8 0.0% 0 125.80s 354 27,037
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 2,887 0
MiniMax M2.5 4.5 2.1 66.7% 1 60.39s 740 9,713
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 1,710 0
MiniMax M2.5 4.6 1.7 66.7% 2 7.48s 266 3,835
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 2.9 6.9 11.1% 1 4.17s 21 0
MiniMax M2.5 2.9 4.4 22.2% 2 237.27s 105,047 133,487
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 6.8 10.0 66.7% 1 9.32s 43 0
MiniMax M2.5 3.8 2.5 33.3% 1 6.63s 25 1,686
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 66 0
MiniMax M2.5 7.5 10.0 50.0% 0 621ms 156 1,495
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 8.3 10.0 77.8% 1 6.91s 298 0
MiniMax M2.5 5.3 7.2 44.4% 1 11.21s 1,069 9,605
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 522 0
MiniMax M2.5 10.0 10.0 100.0% 0 15.35s 269 937
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 3.0 10.0 0.0% 0 17.23s 17 0
MiniMax M2.5 3.0 10.0 0.0% 0 80.79s 1,280 18,535

مقارنة سريعة

تبديل زوج المقارنة