DeepSeek: DeepSeek V3.2 vs MiniMax: MiniMax M2.5

يتقدم DeepSeek V3.2 في متوسط النتيجة بـ 5.0 مقابل 4.6. لدى DeepSeek V3.2 تكلفة benchmark أقل عند $0.054 مقابل $0.340. DeepSeek V3.2 أسرع عند 18.25s مقابل 68.27s، مع معدلات نجاح 37.9% مقابل 45.5%.

النموذج الموصى بهDeepSeek V3.2It has the best score here (5.0), while costing about 6.4x less than MiniMax M2.5 (medium).

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-17

المقياس	DeepSeek V3.2 DeepSeek V3.2 none الإصدار: 2025-12-01	MiniMax M2.5 MiniMax M2.5 medium الإصدار: 2026-02-12

المقياس	DeepSeek V3.2 DeepSeek V3.2 none الإصدار: 2025-12-01	MiniMax M2.5 MiniMax M2.5 medium الإصدار: 2026-02-12
النتيجة	5.0	4.6
الترتيب	#165	#182
الموثوقية	10.0	10.0
الاتساق	7.7	6.2
اختبارات صحيحة
معدل النجاح لكل محاولة	37.9%	45.5%
اختبارات غير مستقرة	6	10
إجمالي مرات التشغيل	66	66
التكلفة لكل نتيجة	0.870	8.648
إجمالي التكلفة	$0.054	$0.340
سعر الإدخال	$0.269 / 1M	$0.150 / 1M
سعر الإخراج	$0.400 / 1M	$0.900 / 1M
إجمالي رموز الإدخال	135,780	142,561
رموز الإخراج	42,097	125,442
رموز الاستدلال	0	339,935
زمن الاستجابة (المتوسط)	18.25s	68.27s
زمن الاستجابة (الحد الأقصى)	115.89s	251.36s
زمن الاستجابة (الإجمالي)	401.60s	955.75s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#165 DeepSeek V3.2

none

التكلفة: $0.002
الوقت: 7.0s
الرموز: 1,046 tok

#182 MiniMax M2.5

medium

SVG غير صالح

التكلفة: $0.000
الوقت: 300.0s
الرموز: 0 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

الفئة:

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	3.2	8.0	8.3%	1		9.35s	494	1,073	0
MiniMax M2.5	7.9	6.3	83.3%	2		20.82s	612	286	45,344

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	3.1	6.9	11.1%	1		14.54s	7,279	4,528	0
MiniMax M2.5	3.4	9.1	0.0%	0		188.58s	6,076	357	106,177

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	4.8	10.0	0.0%	0		113.53s	109,626	33,819	0
MiniMax M2.5	3.7	1.8	50.0%	2		83.19s	119,959	16,687	18,834

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	7,890	1,710	0
MiniMax M2.5	4.6	1.7	66.7%	2		7.48s	6,584	266	3,835

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	2.9	7.2	11.1%	1		4.17s	624	21	0
MiniMax M2.5	2.9	4.4	22.2%	2		237.27s	308	105,047	133,487

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	4.7	1.6	66.7%	1		9.32s	314	43	0
MiniMax M2.5	3.8	2.5	33.3%	1		6.63s	492	25	1,686

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	627	66	0
MiniMax M2.5	7.5	10.0	50.0%	0		621ms	699	156	1,495

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	7.6	7.2	77.8%	1		6.91s	424	298	0
MiniMax M2.5	5.3	7.2	44.4%	1		11.21s	495	1,069	9,605

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	8,319	522	0
MiniMax M2.5	10.0	10.0	100.0%	0		15.35s	7,123	269	937

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	183	17	0
MiniMax M2.5	3.0	10.0	0.0%	0		80.79s	213	1,280	18,535

مقارنة سريعة

تبديل زوج المقارنة

DeepSeek V3.2nonevsMiniMax M2.7medium Mercury 2nonevsMiniMax M2.5medium DeepSeek V3.2nonevsMistral Small 4medium Trinity Large PreviewnonevsMiniMax M2.5medium KAT-Coder-Air V2.5nonevsMiniMax M2.5medium MiniMax M2.5mediumvsGPT-5.4 Nanonone Ring-2.6-1TnonevsMiniMax M2.5medium Ling-2.6-flashnonevsMiniMax M2.5medium MiniMax M2.5mediumvsNemotron 3 Supernoneمتاح مجانًا DeepSeek V3.2nonevsQwen3 Coder Nextmedium CobuddymediumvsDeepSeek V3.2none MiniMax M2.5mediumvsGLM 4.7 Flashnone