AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Xiaomi: MiMo-V2-Pro

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-20

المقياس	DeepSeek V3.2 DeepSeek V3.2 none الإصدار: 2025-12-01	MiMo-V2-Pro MiMo-V2-Pro medium الإصدار: 2026-03-18

المقياس	DeepSeek V3.2 DeepSeek V3.2 none الإصدار: 2025-12-01	MiMo-V2-Pro MiMo-V2-Pro medium الإصدار: 2026-03-18
النتيجة	6.4	8.0
الترتيب	#42	#20
الاتساق	8.5	8.5
اختبارات صحيحة
معدل النجاح لكل محاولة	51.0%	76.5%
اختبارات غير مستقرة	3	3
إجمالي مرات التشغيل	51	45
التكلفة لكل نتيجة	0.220	1.110
إجمالي التكلفة	$0.016	$0.123
??? ???????	$0.260 / 1M	$1.000 / 1M
??? ???????	$0.380 / 1M	$3.000 / 1M
رموز الإخراج	7,831	1,875
رموز الاستدلال	0	26,959
زمن الاستجابة (المتوسط)	12.35s	9.78s
زمن الاستجابة (الحد الأقصى)	115.89s	64.71s
زمن الاستجابة (الإجمالي)	209.94s	156.45s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	3.2	9.8	0.0%	0		7.63s	1,419	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		3.06s	223	1,107

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
MiMo-V2-Pro	4.7	1.6	66.7%	1		64.71s	380	14,186

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
MiMo-V2-Pro	7.3	5.8	83.3%	1		17.20s	260	7,484

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	3.6	7.2	22.2%	1		1.61s	24	0
MiMo-V2-Pro	5.3	10.0	33.3%	0		6.00s	155	1,048

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		2.86s	67	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		4.06s	198	424

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
MiMo-V2-Pro	9.9	10.0	100.0%	0		3.36s	83	667

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	8.5	7.5	88.9%	1		7.37s	1,136	0
MiMo-V2-Pro	7.0	7.2	55.6%	1		4.71s	313	1,179

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		8.19s	263	864

مقارنة سريعة

تبديل زوج المقارنة

Gemini 3 Flash PreviewnonevsMiMo-V2-Promedium Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2-Promedium DeepSeek V3.2nonevsMercury 2medium DeepSeek V3.2nonevsGPT-5 Nanomedium DeepSeek V3.2nonevsGrok 4.20 Multi-Agent Betamedium Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2-Promedium GPT-5.2 ChatnonevsMiMo-V2-Promedium DeepSeek V3.2nonevsgpt-oss-120bmediumمتاح مجانًا GPT-5.3 ChatnonevsMiMo-V2-Promedium DeepSeek V3.2nonevsMiniMax M2.5mediumمتاح مجانًا DeepSeek V3.2nonevsGPT-5 Minimedium DeepSeek V3.2nonevsNemotron 3 Supermediumمتاح مجانًا