التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Xiaomi: MiMo-V2.5-Pro

الملخص

مقارنة benchmark بين DeepSeek V4 Flash و MiMo-V2.5-Pro: يتقدم DeepSeek V4 Flash في متوسط النتيجة بـ 8.3 مقابل 7.4. لدى DeepSeek V4 Flash تكلفة benchmark أقل عند $0.027 مقابل $0.106. MiMo-V2.5-Pro أسرع عند 26.13s مقابل 45.85s، مع معدلات نجاح 74.6% مقابل 68.3%.

النموذج الموصى به: DeepSeek V4 Flash - It has the best score here (8.3), while costing about 4.0x less than MiMo-V2.5-Pro.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس DeepSeek V4 Flash DeepSeek V4 Flash high الإصدار: 2026-04-24 MiMo-V2.5-Pro MiMo-V2.5-Pro medium الإصدار: 2026-04-22
النتيجة 8.3 7.4
الترتيب #23 #51
الموثوقية 10.0 10.0
الاتساق 8.5 8.5
اختبارات صحيحة
معدل النجاح لكل محاولة 74.6% 68.3%
اختبارات غير مستقرة 4 4
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 0.299 2.541
إجمالي التكلفة $0.027 $0.106
سعر الإدخال $0.090 / 1M $0.435 / 1M
سعر الإخراج $0.180 / 1M $0.870 / 1M
إجمالي رموز الإدخال 39,745 40,854
رموز الإخراج 10,310 5,015
رموز الاستدلال 123,501 97,742
زمن الاستجابة (المتوسط) 45.85s 26.13s
زمن الاستجابة (الحد الأقصى) 218.13s 130.77s
زمن الاستجابة (الإجمالي) 962.79s 548.65s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#23 DeepSeek V4 Flash

high
التكلفة
$0.003
الوقت
93.1s
الرموز
7,926 tok

#51 MiMo-V2.5-Pro

medium
SVG غير صالح
التكلفة
$0.000
الوقت
300.0s
الرموز
0 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 540 140 7,770
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.26s 621 323 1,179
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 7.8 10.0 66.7% 0 50.60s 7,279 395 34,862
MiMo-V2.5-Pro 6.2 4.7 66.7% 2 92.07s 6,543 780 51,218
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 14,016 465 7,347
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 15,060 348 11,870
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 7,290 201 1,179
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 7,746 260 8,383
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 4.1 4.4 44.5% 2 100.31s 666 27 59,249
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 630 275 17,023
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 471 79 632
MiMo-V2.5-Pro 5.5 10.0 0.0% 0 4.02s 492 155 163
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 627 63 1,622
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 672 82 803
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 8.2 7.2 88.9% 1 26.11s 594 196 1,767
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.31s 660 540 2,181
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 8,079 228 542
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 8,220 311 2,908
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 3.0 10.0 0.0% 0 54.46s 183 8,516 8,531
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 12.46s 210 1,941 2,014

مقارنة سريعة

تبديل زوج المقارنة