التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Xiaomi: MiMo-V2-Flash

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-29

المقياس Gemini 3 Flash Preview Gemini 3 Flash Preview medium الإصدار: 2025-12-17 MiMo-V2-Flash MiMo-V2-Flash medium الإصدار: 2025-12-16
النتيجة 10.0 7.5
الترتيب #1 #53
الموثوقية غير متاح غير متاح
الاتساق 10.0 8.6
اختبارات صحيحة
معدل النجاح لكل محاولة 100.0% 70.4%
اختبارات غير مستقرة 0 3
إجمالي مرات التشغيل 18 54
التكلفة لكل نتيجة 0.600 0.341
إجمالي التكلفة $0.108 $0.038
??? ??????? $0.500 / 1M $0.090 / 1M
??? ??????? $3.000 / 1M $0.290 / 1M
رموز الإخراج 655 12,387
رموز الاستدلال 33,749 115,182
زمن الاستجابة (المتوسط) 12.11s 23.36s
زمن الاستجابة (الحد الأقصى) 82.37s 96.01s
زمن الاستجابة (الإجمالي) 217.93s 280.34s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.26s 110 1,076
MiMo-V2-Flash 8.1 7.9 83.3% 1 15.85s 1,674 23,559
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 82.37s 144 16,257
MiMo-V2-Flash 4.7 1.6 66.7% 1 13.03s 428 3,648
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 23.58s 117 3,495
MiMo-V2-Flash 9.8 10.0 100.0% 0 75.68s 442 26,859
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 7.62s 93 2,197
MiMo-V2-Flash 6.5 10.0 50.0% 0 0ms 153 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 14.81s 4 7,228
MiMo-V2-Flash 5.9 7.2 55.6% 1 96.01s 8,374 42,461
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.34s 24 635
MiMo-V2-Flash 4.0 10.0 0.0% 0 4.20s 87 488
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.30s 24 903
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 75 3,504
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.86s 61 1,455
MiMo-V2-Flash 7.7 10.0 66.7% 0 3.77s 833 1,948
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.78s 78 503
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 321 12,715

مقارنة سريعة

تبديل زوج المقارنة