التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Google: Gemini 2.5 Flash vs MiniMax: MiniMax M2.5

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس Google: Gemini 2.5 Flash none الإصدار: 2025-06-17 MiniMax: MiniMax M2.5 medium الإصدار: 2026-02-12
الترتيب #36 #35
متوسط الدرجة 5.34 5.64
الاتساق 9.40 6.12
التكلفة لكل نتيجة 0.107 4.028
إجمالي التكلفة $0.007 $0.242
اختبارات صحيحة
معدل النجاح لكل محاولة 47.6% 64.3%
اختبارات غير مستقرة 1 7
رموز الإخراج 826 121,297
رموز الاستدلال 0 203,513

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 1.00 10.00 0.0% 0 99 0
MiniMax: MiniMax M2.5 9.33 7.89 88.9% 1 286 45,112
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 9.88 10.00 100.0% 0 279 0
MiniMax: MiniMax M2.5 5.50 5.81 83.3% 1 369 4,952
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 4.00 7.21 55.6% 1 12 0
MiniMax: MiniMax M2.5 1.00 4.41 22.2% 2 111,023 139,533
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 8.00 9.99 50.0% 0 70 0
MiniMax: MiniMax M2.5 7.00 6.41 66.7% 1 1,121 2,521
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 4.67 10.00 33.3% 0 132 0
MiniMax: MiniMax M2.5 4.33 4.79 55.6% 2 8,229 10,458
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 10.00 10.00 100.0% 0 234 0
MiniMax: MiniMax M2.5 10.00 10.00 100.0% 0 269 937

مقارنة سريعة

تبديل زوج المقارنة