التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-04-20 vs Xiaomi: MiMo-V2-Pro

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-01

المقياس Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 medium الإصدار: 2026-04-20 MiMo-V2-Pro MiMo-V2-Pro medium الإصدار: 2026-03-18
النتيجة 8.1 8.1
الترتيب #34 #33
الموثوقية 9.7 غير متاح
الاتساق 9.0 8.6
اختبارات صحيحة
معدل النجاح لكل محاولة 77.8% 77.8%
اختبارات غير مستقرة 2 3
إجمالي مرات التشغيل 54 48
التكلفة لكل نتيجة 2.065 1.320
إجمالي التكلفة $0.269 $0.159
??? ??????? $0.400 / 1M $1.000 / 1M
??? ??????? $2.400 / 1M $3.000 / 1M
رموز الإخراج 2,179 2,360
رموز الاستدلال 103,832 38,320
زمن الاستجابة (المتوسط) 32.81s 12.27s
زمن الاستجابة (الحد الأقصى) 92.41s 64.71s
زمن الاستجابة (الإجمالي) 590.65s 208.56s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 10.84s 215 7,748
MiMo-V2-Pro 10.0 10.0 100.0% 0 3.06s 223 1,107
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5 Plus 2026-04-20 7.6 10.0 100.0% 0 85.72s 248 11,081
MiMo-V2-Pro 10.0 10.0 100.0% 0 52.12s 485 11,361
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 92.41s 483 17,490
MiMo-V2-Pro 4.7 1.6 66.7% 1 64.71s 380 14,186
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 38.32s 270 14,668
MiMo-V2-Pro 7.3 5.8 83.3% 1 17.20s 260 7,484
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5 Plus 2026-04-20 2.9 7.2 11.1% 1 53.10s 63 28,414
MiMo-V2-Pro 5.3 10.0 33.3% 0 6.00s 155 1,048
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5 Plus 2026-04-20 4.9 9.6 0.0% 0 25.30s 125 4,792
MiMo-V2-Pro 10.0 10.0 100.0% 0 4.06s 198 424
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 20.25s 103 7,689
MiMo-V2-Pro 9.9 10.0 100.0% 0 3.36s 83 667
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5 Plus 2026-04-20 8.2 7.2 88.9% 1 17.58s 324 9,786
MiMo-V2-Pro 7.0 7.2 55.6% 1 4.71s 313 1,179
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 14.72s 348 2,164
MiMo-V2-Pro 10.0 10.0 100.0% 0 8.19s 263 864

مقارنة سريعة

تبديل زوج المقارنة