قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

Arcee AI: Trinity Large Preview (free) vs MoonshotAI: Kimi K2.5

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس	Arcee AI: Trinity Large Preview (free) none الإصدار: 2026-01-27 متاح مجانًا	MoonshotAI: Kimi K2.5 none الإصدار: 2026-01-27
الترتيب	#33	#35
متوسط الدرجة	4.34	4.07
الاتساق	9.97	8.92
التكلفة لكل نتيجة	0.000	0.232
إجمالي التكلفة	$0.000	$0.010
اختبارات صحيحة	5/14	4/14
معدل النجاح لكل محاولة	35.7%	35.7%
اختبارات غير مستقرة	0	2
رموز الإخراج	1,415	1,915
رموز الاستدلال	0	0

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	1.00	10.00	0.0%	0		587	0
MoonshotAI: Kimi K2.5	2.67	7.86	11.1%	1		363	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	9.88	10.00	100.0%	0		186	0
MoonshotAI: Kimi K2.5	5.50	5.81	83.3%	1		995	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	4.00	10.00	33.3%	0		21	0
MoonshotAI: Kimi K2.5	4.00	10.00	33.3%	0		29	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	2.00	9.79	0.0%	0		63	0
MoonshotAI: Kimi K2.5	5.00	9.99	50.0%	0		61	0

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	4.00	9.99	33.3%	0		291	0
MoonshotAI: Kimi K2.5	2.00	9.92	0.0%	0		247	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	10.00	10.00	100.0%	0		267	0
MoonshotAI: Kimi K2.5	10.00	10.00	100.0%	0		220	0

مقارنة سريعة

تبديل زوج المقارنة

Kimi K2.5nonevsGLM 4.7 Flashmedium Trinity Large Preview (free)noneمتاح مجانًاvsGLM 4.7 Flashmedium Kimi K2.5nonevsQwen3 Coder Nextmedium Trinity Large Preview (free)noneمتاح مجانًاvsQwen3 Coder Nextmedium Trinity Large Preview (free)noneمتاح مجانًاvsMiniMax M2.5medium Trinity Large Preview (free)noneمتاح مجانًاvsgpt-oss-120bmediumمتاح مجانًا Trinity Large Preview (free)noneمتاح مجانًاvsQwen3.5-Flashmedium Trinity Large Preview (free)noneمتاح مجانًاvsGPT-5 Nanomedium MiniMax M2.5mediumvsKimi K2.5none Kimi K2.5nonevsgpt-oss-120bmediumمتاح مجانًا Trinity Large Preview (free)noneمتاح مجانًاvsQwen3.5-35B-A3Bmedium Trinity Large Preview (free)noneمتاح مجانًاvsMiMo-V2-Flashmedium