التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5-Flash vs Xiaomi: MiMo-V2.5-Pro

الملخص

مقارنة benchmark بين Qwen3.5-Flash و MiMo-V2.5-Pro: يتقدم MiMo-V2.5-Pro في متوسط النتيجة بـ 7.4 مقابل 6.8. لدى Qwen3.5-Flash تكلفة benchmark أقل عند $0.080 مقابل $0.106. MiMo-V2.5-Pro أسرع عند 26.13s مقابل 63.29s، مع معدلات نجاح 71.4% مقابل 68.3%.

النموذج الموصى به: MiMo-V2.5-Pro - It has the best score here (7.4), while responding about 2.4x faster than Qwen3.5-Flash.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس Qwen3.5-Flash Qwen3.5-Flash medium الإصدار: 2026-02-24 MiMo-V2.5-Pro MiMo-V2.5-Pro medium الإصدار: 2026-04-22
النتيجة 6.8 7.4
الترتيب #70 #51
الموثوقية 10.0 10.0
الاتساق 8.1 8.5
اختبارات صحيحة
معدل النجاح لكل محاولة 71.4% 68.3%
اختبارات غير مستقرة 5 4
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 0.871 2.541
إجمالي التكلفة $0.080 $0.106
سعر الإدخال $0.065 / 1M $0.435 / 1M
سعر الإخراج $0.260 / 1M $0.870 / 1M
إجمالي رموز الإدخال 38,926 40,854
رموز الإخراج 2,088 5,015
رموز الاستدلال 294,598 97,742
زمن الاستجابة (المتوسط) 63.29s 26.13s
زمن الاستجابة (الحد الأقصى) 234.29s 130.77s
زمن الاستجابة (الإجمالي) 1265.85s 548.65s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#70 Qwen3.5-Flash

medium
التكلفة
$0.002
الوقت
25.8s
الرموز
4,294 tok

#51 MiMo-V2.5-Pro

medium
SVG غير صالح
التكلفة
$0.000
الوقت
300.0s
الرموز
0 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 672 383 32,992
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.26s 621 323 1,179
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 3.7 7.2 22.2% 1 58.87s 6,685 302 90,081
MiMo-V2.5-Pro 6.2 4.7 66.7% 2 92.07s 6,543 780 51,218
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 14,934 483 8,270
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 15,060 348 11,870
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 6,061 235 16,237
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 7,746 260 8,383
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 581 58 43,615
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 630 275 17,023
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 516 99 38,486
MiMo-V2.5-Pro 5.5 10.0 0.0% 0 4.02s 492 155 163
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 699 98 14,139
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 672 82 803
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 8.2 7.2 88.9% 1 27.61s 381 89 12,457
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.31s 660 540 2,181
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 8,193 309 1,284
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 8,220 311 2,908
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 3.0 10.0 0.0% 0 48.98s 204 32 37,037
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 12.46s 210 1,941 2,014

مقارنة سريعة

تبديل زوج المقارنة