التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs Nemotron 3 Nano Omni 30b A3b Reasoning

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-29

المقياس Kimi K2.5 Kimi K2.5 none الإصدار: 2026-01-27 Nemotron 3 Nano Omni 30b A3b Reasoning Nemotron 3 Nano Omni 30b A3b Reasoning medium الإصدار: 2026-04-28 متاح مجانًا
النتيجة 5.5 5.2
الترتيب #99 #107
الموثوقية غير متاح 10.0
الاتساق 8.7 5.9
اختبارات صحيحة
معدل النجاح لكل محاولة 40.7% 47.9%
اختبارات غير مستقرة 3 8
إجمالي مرات التشغيل 54 54
التكلفة لكل نتيجة 0.271 0.000
إجمالي التكلفة $0.017 $0.000
??? ??????? $0.440 / 1M $0.000 / 1M
??? ??????? $2.000 / 1M $0.000 / 1M
رموز الإخراج 2,659 50,628
رموز الاستدلال 0 184,655
زمن الاستجابة (المتوسط) 13.37s 14.46s
زمن الاستجابة (الحد الأقصى) 42.13s 147.45s
زمن الاستجابة (الإجمالي) 147.05s 231.37s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
Nemotron 3 Nano Omni 30b A3b Reasoning 7.0 5.9 75.0% 2 2.17s 2,490 3,481
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Kimi K2.5 10.0 10.0 100.0% 0 38.78s 649 0
Nemotron 3 Nano Omni 30b A3b Reasoning 3.3 1.7 33.3% 1 38.09s 6,097 30,508
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
Nemotron 3 Nano Omni 30b A3b Reasoning 0.0 0.0 0.0% 0 0ms 0 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
Nemotron 3 Nano Omni 30b A3b Reasoning 7.3 5.9 83.3% 1 2.72s 890 2,811
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
Nemotron 3 Nano Omni 30b A3b Reasoning 2.9 7.2 11.1% 1 56.67s 40,404 142,623
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
Nemotron 3 Nano Omni 30b A3b Reasoning 4.8 9.9 0.0% 0 1.43s 41 850
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
Nemotron 3 Nano Omni 30b A3b Reasoning 6.9 6.3 66.7% 1 1.53s 192 1,728
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Kimi K2.5 3.1 10.0 0.0% 0 4.73s 317 0
Nemotron 3 Nano Omni 30b A3b Reasoning 3.5 4.4 33.3% 2 1.56s 514 2,654
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0
Nemotron 3 Nano Omni 30b A3b Reasoning 0.0 0.0 0.0% 0 0ms 0 0

مقارنة سريعة

تبديل زوج المقارنة