AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs Elephant Alpha

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-29

المقياس	Kimi K2.5 Kimi K2.5 none الإصدار: 2026-01-27	Elephant Alpha Elephant Alpha medium الإصدار: 2026-04-14

المقياس	Kimi K2.5 Kimi K2.5 none الإصدار: 2026-01-27	Elephant Alpha Elephant Alpha medium الإصدار: 2026-04-14
النتيجة	5.3	5.4
الترتيب	#133	#127
الموثوقية	10.0	غير متاح
الاتساق	8.9	9.6
اختبارات صحيحة
معدل النجاح لكل محاولة	36.7%	33.3%
اختبارات غير مستقرة	3	1
إجمالي مرات التشغيل	60	60
التكلفة لكل نتيجة	0.425	0.000
إجمالي التكلفة	$0.026	$0.000
سعر الإدخال	$0.400 / 1M	$0.000 / 1M
سعر الإخراج	$1.900 / 1M	$0.000 / 1M
رموز الإخراج	6,653	2,596
رموز الاستدلال	0	0
زمن الاستجابة (المتوسط)	14.06s	1.27s
زمن الاستجابة (الحد الأقصى)	42.13s	3.70s
زمن الاستجابة (الإجمالي)	182.72s	22.82s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.5	3.6	8.4	8.3%	1		6.24s	373	0
Elephant Alpha	6.6	10.0	50.0%	0		1.19s	815	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.5	6.8	10.0	50.0%	0		35.97s	4,704	0
Elephant Alpha	4.0	6.7	16.7%	1		1.30s	365	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.5	2.8	2.1	33.3%	1		19.16s	748	0
Elephant Alpha	3.0	10.0	0.0%	0		3.70s	562	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.5	7.3	5.8	83.3%	1		42.13s	187	0
Elephant Alpha	6.5	10.0	50.0%	0		979ms	246	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.5	5.3	10.0	33.3%	0		4.38s	29	0
Elephant Alpha	3.0	10.0	0.0%	0		925ms	24	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.5	10.0	10.0	100.0%	0		4.00s	76	0
Elephant Alpha	4.3	10.0	0.0%	0		920ms	105	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.5	6.5	10.0	50.0%	0		2.67s	60	0
Elephant Alpha	9.8	10.0	100.0%	0		987ms	82	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.5	3.0	10.0	0.0%	0		4.04s	236	0
Elephant Alpha	5.3	10.0	33.3%	0		868ms	166	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.5	10.0	10.0	100.0%	0		13.99s	220	0
Elephant Alpha	3.0	10.0	0.0%	0		2.83s	231	0

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Kimi K2.5	3.0	10.0	0.0%	0		3.90s	20	0
Elephant Alpha	0.0	0.0	0.0%	0		0ms	0	0

مقارنة سريعة

تبديل زوج المقارنة

Elephant AlphamediumvsQwen3.5-122B-A10Bnone Elephant AlphamediumvsGrok 4.20none gpt-oss-120bnoneمتاح مجانًاvsElephant Alphamedium Elephant AlphamediumvsGLM 5 Turbonone MiniMax M2.7mediumvsKimi K2.5none Ling-2.6-flashnonevsElephant Alphamedium Mistral Small 4mediumvsKimi K2.5none Elephant AlphamediumvsQwen3.6 Flashnone MiniMax M2.5mediumمتاح مجانًاvsKimi K2.5none Elephant AlphamediumvsMiMo-V2.5-Pronone GPT-5.4nonevsElephant Alphamedium Kimi K2.6noneمتاح مجانًاvsElephant Alphamedium