التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5-9B vs Xiaomi: MiMo-V2-Flash

الملخص

مقارنة benchmark بين Qwen3.5-9B و MiMo-V2-Flash: يتقدم MiMo-V2-Flash في متوسط النتيجة بـ 4.6 مقابل 4.2. لدى MiMo-V2-Flash تكلفة benchmark أقل عند $0.025 مقابل $0.036. MiMo-V2-Flash أسرع عند 2.76s مقابل 82.24s، مع معدلات نجاح 27.0% مقابل 25.4%.

النموذج الموصى به: MiMo-V2-Flash - It has the best score here (4.6), while responding about 29.8x faster than Qwen3.5-9B.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-10

المقياس Qwen3.5-9B Qwen3.5-9B medium الإصدار: 2026-03-02 MiMo-V2-Flash MiMo-V2-Flash none الإصدار: 2025-12-16
النتيجة 4.2 4.6
الترتيب #162 #153
الموثوقية 6.7 6.7
الاتساق 8.0 8.5
اختبارات صحيحة
معدل النجاح لكل محاولة 27.0% 25.4%
اختبارات غير مستقرة 5 4
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 1.187 0.584
إجمالي التكلفة $0.036 $0.025
سعر الإدخال $0.100 / 1M $0.100 / 1M
سعر الإخراج $0.150 / 1M $0.300 / 1M
إجمالي رموز الإدخال 17,070 36,851
رموز الإخراج 29,045 68,882
رموز الاستدلال 209,516 0
زمن الاستجابة (المتوسط) 82.24s 2.76s
زمن الاستجابة (الحد الأقصى) 226.38s 19.68s
زمن الاستجابة (الإجمالي) 1315.88s 46.99s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#162 Qwen3.5-9B

medium
Cost
$0.001
Time
35.9s
Tokens
3,030 tok

#153 MiMo-V2-Flash

none
Cost
$0.001
Time
7.7s
Tokens
1,481 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 369 2,621 12,411
MiMo-V2-Flash 3.2 8.0 8.3% 1 1.19s 645 865 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-9B 2.9 10.0 0.0% 0 100.88s 2,396 7,890 41,129
MiMo-V2-Flash 4.3 7.9 11.1% 1 2.64s 7,442 763 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0 0
MiMo-V2-Flash 3.0 10.0 0.0% 0 2.87s 15,075 330 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 4,722 1,383 32,113
MiMo-V2-Flash 2.9 5.8 16.7% 1 19.68s 2,622 161 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 295 11,549 48,475
MiMo-V2-Flash 5.3 7.2 44.4% 1 564ms 753 24 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 180 0 30,695
MiMo-V2-Flash 4.6 10.0 0.0% 0 1.67s 498 104 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-9B 6.5 10.0 50.0% 0 5.75s 381 491 1,824
MiMo-V2-Flash 6.5 10.0 50.0% 0 857ms 684 69 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-9B 3.0 10.0 0.0% 0 32.27s 376 1,593 12,026
MiMo-V2-Flash 5.3 10.0 33.3% 0 1.86s 678 66,282 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 8,283 444 1,149
MiMo-V2-Flash 10.0 10.0 100.0% 0 2.28s 8,238 272 0
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.5-9B 3.0 10.0 0.0% 0 177.02s 68 3,074 29,694
MiMo-V2-Flash 3.0 10.0 0.0% 0 1.82s 216 12 0

مقارنة سريعة

تبديل زوج المقارنة