التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

MiniMax: MiniMax M2.7 vs OpenAI: GPT-5.4 Mini

الملخص

مقارنة benchmark بين MiniMax M2.7 و GPT-5.4 Mini: يتقدم GPT-5.4 Mini في متوسط النتيجة بـ 5.3 مقابل 5.2. لدى GPT-5.4 Mini تكلفة benchmark أقل عند $0.038 مقابل $0.104. GPT-5.4 Mini أسرع عند 1.13s مقابل 38.18s، مع معدلات نجاح 46.0% مقابل 30.2%.

النموذج الموصى به: GPT-5.4 Mini - It has the best score here (5.3), while costing about 2.8x less than MiniMax M2.7.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-12

المقياس MiniMax M2.7 MiniMax M2.7 medium الإصدار: 2026-03-18 GPT-5.4 Mini GPT-5.4 Mini none الإصدار: 2026-03-17
النتيجة 5.2 5.3
الترتيب #134 #131
الموثوقية 10.0 10.0
الاتساق 6.8 8.8
اختبارات صحيحة
معدل النجاح لكل محاولة 46.0% 30.2%
اختبارات غير مستقرة 8 3
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 2.494 0.743
إجمالي التكلفة $0.104 $0.038
سعر الإدخال $0.250 / 1M $0.750 / 1M
سعر الإخراج $1.000 / 1M $4.500 / 1M
إجمالي رموز الإدخال 34,371 34,244
رموز الإخراج 8,981 2,541
رموز الاستدلال 89,812 0
زمن الاستجابة (المتوسط) 38.18s 1.13s
زمن الاستجابة (الحد الأقصى) 196.21s 2.52s
زمن الاستجابة (الإجمالي) 763.60s 23.82s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#134 MiniMax M2.7

medium
Cost
$0.022
Time
22.8s
Tokens
9,250 tok

#131 GPT-5.4 Mini

none
Cost
$0.010
Time
11.7s
Tokens
2,151 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M2.7 7.9 6.3 83.3% 2 40.32s 654 3,010 17,716
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 606 654 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M2.7 5.7 9.1 33.3% 0 101.89s 2,961 1,231 38,841
GPT-5.4 Mini 5.5 10.0 33.3% 0 913ms 7,305 401 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M2.7 4.7 1.6 66.7% 1 41.03s 14,233 369 4,480
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 11,019 298 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M2.7 6.3 5.8 66.7% 1 21.95s 7,152 187 5,882
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 7,140 222 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M2.7 3.0 10.0 0.0% 0 19.00s 245 8 2,796
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 723 88 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M2.7 3.9 2.5 33.3% 1 38.70s 486 92 5,204
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 477 174 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M2.7 3.8 5.8 33.3% 1 12.80s 687 350 2,600
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 660 101 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M2.7 5.9 7.2 55.6% 1 24.87s 675 362 7,840
GPT-5.4 Mini 5.4 10.0 33.3% 0 836ms 642 305 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M2.7 4.7 1.6 66.7% 1 12.05s 7,067 304 1,001
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 5,477 255 0
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M2.7 3.0 10.0 0.0% 0 22.77s 211 3,068 3,452
GPT-5.4 Mini 3.0 10.0 0.0% 0 1.33s 195 43 0

مقارنة سريعة

تبديل زوج المقارنة