AI BENCHY Compare

Cobuddy vs MoonshotAI: Kimi K2.5

الملخص

مقارنة benchmark بين Cobuddy و Kimi K2.5: يتقدم Kimi K2.5 في متوسط النتيجة بـ 5.5 مقابل 4.9. لدى Cobuddy تكلفة benchmark أقل عند $0.000 مقابل $0.027. Kimi K2.5 أسرع عند 13.18s مقابل 39.90s، مع معدلات نجاح 47.6% مقابل 34.9%.

النموذج الموصى به: Kimi K2.5 - It has the best score here (5.5), while responding about 3.0x faster than Cobuddy.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-02

المقياس	Cobuddy Cobuddy medium الإصدار: 2026-05-06	Kimi K2.5 Kimi K2.5 none الإصدار: 2026-01-27

المقياس	Cobuddy Cobuddy medium الإصدار: 2026-05-06	Kimi K2.5 Kimi K2.5 none الإصدار: 2026-01-27
النتيجة	4.9	5.5
الترتيب	#145	#122
الموثوقية	10.0	10.0
الاتساق	7.5	8.9
اختبارات صحيحة
معدل النجاح لكل محاولة	47.6%	34.9%
اختبارات غير مستقرة	6	3
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	0.000	0.442
إجمالي التكلفة	$0.000	$0.027
سعر الإدخال	$0.000 / 1M	$0.375 / 1M
سعر الإخراج	$0.000 / 1M	$2.025 / 1M
إجمالي رموز الإدخال	37,449	36,034
رموز الإخراج	1,677	6,657
رموز الاستدلال	116,703	0
زمن الاستجابة (المتوسط)	39.90s	13.18s
زمن الاستجابة (الحد الأقصى)	309.02s	42.13s
زمن الاستجابة (الإجمالي)	797.98s	184.47s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#145 Cobuddy

medium

No endpoints found for baidu/cobuddy:free.

التكلفة: $0.000
الوقت: 0.1s
الرموز: 0 tok

#122 MoonshotAI: Kimi K2.5

none

التكلفة: $0.015
الوقت: 89.1s
الرموز: 5,421 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Cobuddy	8.7	7.9	91.7%	1		10.00s	453	98	4,666
Kimi K2.5	3.6	8.4	8.3%	1		6.24s	652	373	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Cobuddy	3.7	6.7	22.2%	1		79.17s	4,726	358	30,138
Kimi K2.5	5.5	10.0	33.3%	0		24.56s	7,311	4,708	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Cobuddy	3.0	10.0	0.0%	0		47.38s	18,324	465	7,265
Kimi K2.5	2.8	2.1	33.3%	1		19.16s	12,264	748	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Cobuddy	6.3	5.8	66.7%	1		17.36s	8,181	275	5,591
Kimi K2.5	7.3	5.8	83.3%	1		42.13s	7,180	187	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Cobuddy	2.9	4.4	22.2%	2		128.15s	540	10	49,454
Kimi K2.5	5.3	10.0	33.3%	0		4.38s	753	29	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Cobuddy	4.2	9.9	0.0%	0		23.23s	498	76	3,782
Kimi K2.5	10.0	10.0	100.0%	0		4.00s	483	76	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Cobuddy	9.8	10.0	100.0%	0		11.60s	508	64	2,842
Kimi K2.5	6.5	10.0	50.0%	0		2.67s	677	60	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Cobuddy	3.6	7.2	22.2%	1		12.83s	561	189	5,808
Kimi K2.5	3.0	10.0	0.0%	0		4.04s	667	236	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Cobuddy	10.0	10.0	100.0%	0		11.19s	3,505	133	294
Kimi K2.5	10.0	10.0	100.0%	0		13.99s	5,835	220	0

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Cobuddy	3.0	10.0	0.0%	0		36.98s	153	9	6,863
Kimi K2.5	3.0	10.0	0.0%	0		3.90s	212	20	0

مقارنة سريعة

تبديل زوج المقارنة

CobuddymediumvsGPT-4o-mininone CobuddymediumvsGLM 4.7 Flashnone CobuddymediumvsNemotron 3 Supernoneمتاح مجانًا CobuddymediumvsLing-2.6-flashnone Trinity Large PreviewnonevsCobuddymedium CobuddymediumvsRing-2.6-1Tnone CobuddymediumvsGPT-5.4 Nanonone CobuddymediumvsQwen3.5-9Bnone CobuddymediumvsMiMo-V2.5none CobuddymediumvsNorth Mini Codenoneمتاح مجانًا CobuddymediumvsQwen3 Coder Nextnone CobuddymediumvsMistral Small 4none