التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

Inception: Mercury 2 vs MiniMax: MiniMax M2.5

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-03

المقياس Mercury 2 Mercury 2 none الإصدار: 2026-02-24 MiniMax M2.5 MiniMax M2.5 medium الإصدار: 2026-02-12
النتيجة 4.6 5.5
الترتيب #153 #125
الموثوقية 10.0 10.0
الاتساق 9.1 6.4
اختبارات صحيحة
معدل النجاح لكل محاولة 25.0% 48.3%
اختبارات غير مستقرة 2 9
إجمالي مرات التشغيل 60 60
التكلفة لكل نتيجة 0.216 6.075
إجمالي التكلفة $0.009 $0.294
سعر الإدخال $0.250 / 1M $0.150 / 1M
سعر الإخراج $0.750 / 1M $1.150 / 1M
إجمالي رموز الإدخال 25,515 41,948
رموز الإخراج 3,001 109,492
رموز الاستدلال 0 251,674
زمن الاستجابة (المتوسط) 614ms 49.87s
زمن الاستجابة (الحد الأقصى) 1.27s 237.27s
زمن الاستجابة (الإجمالي) 12.28s 598.39s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
MiniMax M2.5 7.9 6.3 83.3% 2 20.82s 612 286 45,344
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 3.5 9.4 0.0% 0 831ms 4,631 1,650 0
MiniMax M2.5 3.5 9.8 0.0% 0 125.80s 4,318 354 27,037
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
MiniMax M2.5 4.5 2.1 66.7% 1 60.39s 21,104 740 9,713
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
MiniMax M2.5 4.6 1.7 66.7% 2 7.48s 6,584 266 3,835
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
MiniMax M2.5 2.9 4.4 22.2% 2 237.27s 308 105,047 133,487
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
MiniMax M2.5 3.8 2.5 33.3% 1 6.63s 492 25 1,686
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
MiniMax M2.5 7.5 10.0 50.0% 0 621ms 699 156 1,495
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
MiniMax M2.5 5.3 7.2 44.4% 1 11.21s 495 1,069 9,605
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
MiniMax M2.5 10.0 10.0 100.0% 0 15.35s 7,123 269 937
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0
MiniMax M2.5 3.0 10.0 0.0% 0 80.79s 213 1,280 18,535

مقارنة سريعة

تبديل زوج المقارنة