AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Xiaomi: MiMo-V2.5-Pro

الملخص

مقارنة benchmark بين DeepSeek V4 Pro و MiMo-V2.5-Pro: يتقدم DeepSeek V4 Pro في متوسط النتيجة بـ 7.6 مقابل 7.4. لدى MiMo-V2.5-Pro تكلفة benchmark أقل عند $0.106 مقابل $0.157. MiMo-V2.5-Pro أسرع عند 26.13s مقابل 77.20s، مع معدلات نجاح 66.7% مقابل 68.3%.

النموذج الموصى به: MiMo-V2.5-Pro - Its score stays close to the best score here (7.4 vs 7.6), while responding about 3.0x faster than DeepSeek V4 Pro.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-17

المقياس	DeepSeek V4 Pro DeepSeek V4 Pro high الإصدار: 2026-04-24	MiMo-V2.5-Pro MiMo-V2.5-Pro medium الإصدار: 2026-04-22

المقياس	DeepSeek V4 Pro DeepSeek V4 Pro high الإصدار: 2026-04-24	MiMo-V2.5-Pro MiMo-V2.5-Pro medium الإصدار: 2026-04-22
النتيجة	7.6	7.4
الترتيب	#41	#51
الموثوقية	9.3	10.0
الاتساق	7.0	8.5
اختبارات صحيحة
معدل النجاح لكل محاولة	66.7%	68.3%
اختبارات غير مستقرة	8	4
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	1.742	2.541
إجمالي التكلفة	$0.157	$0.106
سعر الإدخال	$0.435 / 1M	$0.435 / 1M
سعر الإخراج	$0.870 / 1M	$0.870 / 1M
إجمالي رموز الإدخال	38,726	40,854
رموز الإخراج	6,334	5,015
رموز الاستدلال	159,151	97,742
زمن الاستجابة (المتوسط)	77.20s	26.13s
زمن الاستجابة (الحد الأقصى)	416.76s	130.77s
زمن الاستجابة (الإجمالي)	1621.17s	548.65s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#41 DeepSeek V4 Pro

high

Cost: $0.023
Time: 257.6s
Tokens: 14,870 tok

#51 MiMo-V2.5-Pro

medium

Invalid SVG

Cost: $0.000
Time: 300.0s
Tokens: 0 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	5.7	5.9	58.3%	2		25.70s	536	149	3,214
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.26s	621	323	1,179

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	6.1	4.6	66.7%	2		243.00s	5,090	383	84,580
MiMo-V2.5-Pro	6.2	4.7	66.7%	2		92.07s	6,543	780	51,218

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	10.0	10.0	100.0%	0		38.17s	14,060	454	5,836
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		53.36s	15,060	348	11,870

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	10.0	10.0	100.0%	0		25.03s	7,690	274	2,166
MiMo-V2.5-Pro	7.3	5.8	83.3%	1		18.81s	7,746	260	8,383

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	3.6	7.2	22.2%	1		151.46s	569	4,404	50,391
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		37.87s	630	275	17,023

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	10.0	10.0	100.0%	0		8.83s	471	115	1,013
MiMo-V2.5-Pro	5.5	10.0	0.0%	0		4.02s	492	155	163

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	7.8	6.6	83.3%	1		8.73s	627	66	2,726
MiMo-V2.5-Pro	9.9	10.0	100.0%	0		2.77s	672	82	803

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	6.9	4.9	77.8%	2		56.85s	591	178	2,563
MiMo-V2.5-Pro	6.7	7.9	55.6%	1		5.31s	660	540	2,181

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	9.8	10.0	100.0%	0		15.92s	8,909	295	701
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		16.87s	8,220	311	2,908

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	3.0	10.0	0.0%	0		34.01s	183	16	5,961
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		12.46s	210	1,941	2,014

مقارنة سريعة

تبديل زوج المقارنة

DeepSeek V4 ProhighvsMiniMax M3medium DeepSeek V4 ProhighvsGrok Build 0.1medium Gemini 3 Flash PreviewlowvsMiMo-V2.5-Promedium DeepSeek V4 ProhighvsKimi K2.5medium DeepSeek V4 ProhighvsMercury 2medium DeepSeek V4 ProhighvsStep 3.7 Flashlow Claude Opus 4.6mediumvsDeepSeek V4 Prohigh DeepSeek V4 ProhighvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsMiMo-V2.5-Promedium DeepSeek V4 ProhighvsGPT-5.4 Nanomedium Claude Sonnet 4.6nonevsMiMo-V2.5-Promedium DeepSeek V4 ProhighvsGrok 4.3medium