التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs MiniMax: MiniMax M3

الملخص

مقارنة benchmark بين Mercury 2 و MiniMax M3: يتقدم MiniMax M3 في متوسط النتيجة بـ 7.6 مقابل 7.5. لدى Mercury 2 تكلفة benchmark أقل عند $0.058 مقابل $0.131. Mercury 2 أسرع عند 2.24s مقابل 68.17s، مع معدلات نجاح 54.0% مقابل 65.1%.

النموذج الموصى به: Mercury 2 - Its score stays close to the best score here (7.5 vs 7.6), while costing about 2.3x less than MiniMax M3.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس Mercury 2 Mercury 2 medium الإصدار: 2026-02-24 MiniMax M3 MiniMax M3 medium الإصدار: 2026-06-01
النتيجة 7.5 7.6
الترتيب #44 #40
الموثوقية 10.0 9.6
الاتساق 8.8 7.9
اختبارات صحيحة
معدل النجاح لكل محاولة 54.0% 65.1%
اختبارات غير مستقرة 3 5
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 0.578 1.187
إجمالي التكلفة $0.058 $0.131
سعر الإدخال $0.250 / 1M $0.300 / 1M
سعر الإخراج $0.750 / 1M $1.200 / 1M
إجمالي رموز الإدخال 35,116 46,546
رموز الإخراج 4,048 49,036
رموز الاستدلال 61,219 92,543
زمن الاستجابة (المتوسط) 2.24s 68.17s
زمن الاستجابة (الحد الأقصى) 14.63s 431.03s
زمن الاستجابة (الإجمالي) 44.72s 1363.38s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#44 Mercury 2

medium
التكلفة
$0.002
الوقت
2.1s
الرموز
1,702 tok

#40 MiniMax M3

medium
التكلفة
$0.012
الوقت
154.4s
الرموز
10,018 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 6.9 9.9 50.0% 0 1.12s 554 2,546 2,609
MiniMax M3 5.5 3.7 66.7% 3 14.95s 2,526 874 3,414
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 8.2 7.7 77.8% 1 2.04s 7,065 296 11,328
MiniMax M3 6.1 6.5 55.6% 1 144.74s 5,804 6,223 32,667
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 10.0 10.0 100.0% 0 3.28s 12,909 268 4,887
MiniMax M3 10.0 10.0 100.0% 0 65.30s 14,760 1,306 6,253
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 7.3 5.9 83.3% 1 1.11s 6,234 183 1,656
MiniMax M3 10.0 10.0 100.0% 0 14.92s 8,088 514 3,164
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 2.9 7.2 11.1% 1 6.48s 695 41 30,754
MiniMax M3 5.5 9.3 33.3% 0 233.13s 869 16,254 19,070
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 4.8 10.0 0.0% 0 821ms 456 137 542
MiniMax M3 5.1 3.4 33.3% 1 33.25s 954 2,487 2,523
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 10.0 10.0 100.0% 0 1.07s 340 14 958
MiniMax M3 9.8 10.0 100.0% 0 6.14s 1,623 103 920
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 5.4 10.0 33.3% 0 949ms 601 361 2,781
MiniMax M3 7.9 9.9 66.7% 0 49.91s 2,079 11,946 13,761
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 10.0 10.0 100.0% 0 1.89s 6,080 180 1,956
MiniMax M3 10.0 10.0 100.0% 0 11.91s 9,168 281 555
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 3.0 10.0 0.0% 0 2.58s 182 22 3,748
MiniMax M3 3.0 10.0 0.0% 0 100.80s 675 9,048 10,216

مقارنة سريعة

تبديل زوج المقارنة