التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs MiniMax: MiniMax M2.7

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-18

المقياس Mercury 2 Mercury 2 none الإصدار: 2026-02-24 MiniMax M2.7 MiniMax M2.7 medium الإصدار: 2026-03-18
النتيجة 4.8 5.0
الترتيب #66 #64
الاتساق 9.0 5.3
اختبارات صحيحة
معدل النجاح لكل محاولة 29.4% 49.0%
اختبارات غير مستقرة 2 10
إجمالي مرات التشغيل 51 51
التكلفة لكل نتيجة 0.154 2.398
إجمالي التكلفة $0.007 $0.072
??? ??????? $0.250 / 1M $0.300 / 1M
??? ??????? $0.750 / 1M $1.200 / 1M
رموز الإخراج 1,315 4,517
رموز الاستدلال 0 47,612
زمن الاستجابة (المتوسط) 592ms 27.32s
زمن الاستجابة (الحد الأقصى) 1.27s 117.04s
زمن الاستجابة (الإجمالي) 10.07s 437.10s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
MiniMax M2.7 7.9 6.3 83.3% 2 40.32s 3,010 17,716
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
MiniMax M2.7 4.7 1.6 66.7% 1 41.03s 369 4,480
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
MiniMax M2.7 6.3 5.8 66.7% 1 21.95s 187 5,882
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
MiniMax M2.7 3.0 10.0 0.0% 0 19.00s 8 2,796
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
MiniMax M2.7 3.9 2.5 33.3% 1 38.70s 92 5,204
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
MiniMax M2.7 3.7 1.8 50.0% 2 12.64s 213 2,457
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
MiniMax M2.7 3.8 4.5 33.3% 2 25.62s 334 8,076
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
MiniMax M2.7 4.7 1.6 66.7% 1 12.05s 304 1,001

مقارنة سريعة

تبديل زوج المقارنة