التنقل
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Xiaomi: MiMo-V2-Flash

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-24

المقياس Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low الإصدار: 2026-03-03 MiMo-V2-Flash MiMo-V2-Flash medium الإصدار: 2025-12-16
النتيجة 8.1 7.5
الترتيب #26 #49
الموثوقية غير متاح غير متاح
الاتساق 10.0 8.6
اختبارات صحيحة
معدل النجاح لكل محاولة 72.2% 70.4%
اختبارات غير مستقرة 0 3
إجمالي مرات التشغيل 54 54
التكلفة لكل نتيجة 0.168 0.341
إجمالي التكلفة $0.022 $0.038
??? ??????? $0.250 / 1M $0.090 / 1M
??? ??????? $1.500 / 1M $0.290 / 1M
رموز الإخراج 2,247 12,387
رموز الاستدلال 8,058 115,182
زمن الاستجابة (المتوسط) 3.22s 23.36s
زمن الاستجابة (الحد الأقصى) 11.91s 96.01s
زمن الاستجابة (الإجمالي) 58.00s 280.34s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 462 1,638
MiMo-V2-Flash 8.1 7.9 83.3% 1 15.85s 1,674 23,559
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.20s 630 372
MiMo-V2-Flash 4.7 1.6 66.7% 1 13.03s 428 3,648
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 225 762
MiMo-V2-Flash 9.8 10.0 100.0% 0 75.68s 442 26,859
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 291 696
MiMo-V2-Flash 6.5 10.0 50.0% 0 0ms 153 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 18 1,212
MiMo-V2-Flash 5.9 7.2 55.6% 1 96.01s 8,374 42,461
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 69 384
MiMo-V2-Flash 4.0 10.0 0.0% 0 4.20s 87 488
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 75 3,504
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.76s 243 1,248
MiMo-V2-Flash 7.7 10.0 66.7% 0 3.77s 833 1,948
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 321 12,715

مقارنة سريعة

تبديل زوج المقارنة