التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MiniMax: MiniMax M3 vs MoonshotAI: Kimi K2.5

الملخص

مقارنة benchmark بين MiniMax M3 و Kimi K2.5: يتقدم MiniMax M3 في متوسط النتيجة بـ 7.6 مقابل 7.5. لدى MiniMax M3 تكلفة benchmark أقل عند $0.131 مقابل $0.348. MiniMax M3 أسرع عند 68.17s مقابل 98.43s، مع معدلات نجاح 65.1% مقابل 68.3%.

النموذج الموصى به: MiniMax M3 - It has the best score here (7.6), while costing about 2.7x less than Kimi K2.5.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-02

المقياس MiniMax M3 MiniMax M3 medium الإصدار: 2026-06-01 Kimi K2.5 Kimi K2.5 medium الإصدار: 2026-01-27
النتيجة 7.6 7.5
الترتيب #42 #45
الموثوقية 9.6 10.0
الاتساق 7.9 6.9
اختبارات صحيحة
معدل النجاح لكل محاولة 65.1% 68.3%
اختبارات غير مستقرة 5 8
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 1.187 3.704
إجمالي التكلفة $0.131 $0.348
سعر الإدخال $0.300 / 1M $0.375 / 1M
سعر الإخراج $1.200 / 1M $2.025 / 1M
إجمالي رموز الإدخال 46,546 34,312
رموز الإخراج 49,036 48,379
رموز الاستدلال 92,543 157,747
زمن الاستجابة (المتوسط) 68.17s 98.43s
زمن الاستجابة (الحد الأقصى) 431.03s 281.00s
زمن الاستجابة (الإجمالي) 1363.38s 1378.03s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#42 MiniMax M3

medium
التكلفة
$0.012
الوقت
154.4s
الرموز
10,018 tok

#45 MoonshotAI: Kimi K2.5

medium
التكلفة
$0.030
الوقت
58.6s
الرموز
8,683 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M3 5.5 3.7 66.7% 3 14.95s 2,526 874 3,414
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 634 2,789 8,880
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M3 6.1 6.5 55.6% 1 144.74s 5,804 6,223 32,667
Kimi K2.5 6.1 4.6 66.7% 2 217.49s 6,935 5,705 74,693
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M3 10.0 10.0 100.0% 0 65.30s 14,760 1,306 6,253
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 11,280 703 3,713
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M3 10.0 10.0 100.0% 0 14.92s 8,088 514 3,164
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 7,020 563 7,940
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M3 5.5 9.3 33.3% 0 233.13s 869 16,254 19,070
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 485 20,753 30,564
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M3 5.1 3.4 33.3% 1 33.25s 954 2,487 2,523
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 480 3,815 4,262
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M3 9.8 10.0 100.0% 0 6.14s 1,623 103 920
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 675 5,371 6,547
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M3 7.9 9.9 66.7% 0 49.91s 2,079 11,946 13,761
Kimi K2.5 5.3 7.3 44.4% 1 43.23s 659 8,426 12,692
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M3 10.0 10.0 100.0% 0 11.91s 9,168 281 555
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 5,933 242 812
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
MiniMax M3 3.0 10.0 0.0% 0 100.80s 675 9,048 10,216
Kimi K2.5 3.0 10.0 0.0% 0 83.95s 211 12 7,644

مقارنة سريعة

تبديل زوج المقارنة