AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Xiaomi: MiMo-V2-Pro

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-29

المقياس	DeepSeek V3.2 DeepSeek V3.2 none الإصدار: 2025-12-01	MiMo-V2-Pro MiMo-V2-Pro none الإصدار: 2026-03-18

المقياس	DeepSeek V3.2 DeepSeek V3.2 none الإصدار: 2025-12-01	MiMo-V2-Pro MiMo-V2-Pro none الإصدار: 2026-03-18
النتيجة	6.0	6.0
الترتيب	#84	#85
الموثوقية	غير متاح	غير متاح
الاتساق	8.6	8.6
اختبارات صحيحة
معدل النجاح لكل محاولة	46.3%	48.2%
اختبارات غير مستقرة	3	3
إجمالي مرات التشغيل	52	54
التكلفة لكل نتيجة	0.225	0.601
إجمالي التكلفة	$0.016	$0.043
??? ???????	$0.252 / 1M	$1.000 / 1M
??? ???????	$0.378 / 1M	$3.000 / 1M
رموز الإخراج	8,378	2,320
رموز الاستدلال	0	0
زمن الاستجابة (المتوسط)	12.07s	2.39s
زمن الاستجابة (الحد الأقصى)	115.89s	6.58s
زمن الاستجابة (الإجمالي)	217.28s	43.06s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	3.2	9.8	0.0%	0		7.63s	1,419	0
MiMo-V2-Pro	3.5	8.0	16.7%	1		1.80s	315	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	2.4	1.3	33.3%	1		7.63s	553	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		3.82s	599	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
MiMo-V2-Pro	3.0	10.0	0.0%	0		6.58s	333	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		1.39s	249	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	3.0	10.0	0.0%	0		1.52s	18	0
MiMo-V2-Pro	5.3	7.2	44.4%	1		1.78s	26	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		2.86s	67	0
MiMo-V2-Pro	4.3	9.9	0.0%	0		2.44s	125	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
MiMo-V2-Pro	6.5	10.0	50.0%	0		2.51s	69	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	8.5	7.5	88.9%	1		7.37s	1,136	0
MiMo-V2-Pro	6.0	7.1	55.6%	1		1.83s	327	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		4.39s	277	0

مقارنة سريعة

تبديل زوج المقارنة

DeepSeek V3.2nonevsLaguna Xs.2mediumمتاح مجانًا Laguna Xs.2mediumمتاح مجانًاvsMiMo-V2-Pronone gpt-oss-120bmediumمتاح مجانًاvsMiMo-V2-Pronone DeepSeek V3.2nonevsgpt-oss-120bmediumمتاح مجانًا DeepSeek V3.2nonevsGPT-5 Nanomedium GPT-5 NanomediumvsMiMo-V2-Pronone MiniMax M2.5mediumمتاح مجانًاvsMiMo-V2-Pronone DeepSeek V3.2nonevsMiniMax M2.5mediumمتاح مجانًا DeepSeek V3.2nonevsLaguna M.1mediumمتاح مجانًا Laguna M.1mediumمتاح مجانًاvsMiMo-V2-Pronone Mistral Small 4mediumvsMiMo-V2-Pronone DeepSeek V3.2nonevsMistral Small 4medium