AI BENCHY Compare

Cobuddy vs Inception: Mercury 2

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-22

المقياس	Cobuddy Cobuddy medium الإصدار: 2026-05-06 متاح مجانًا	Mercury 2 Mercury 2 medium الإصدار: 2026-02-24

المقياس	Cobuddy Cobuddy medium الإصدار: 2026-05-06 متاح مجانًا	Mercury 2 Mercury 2 medium الإصدار: 2026-02-24
النتيجة	5.7	6.3
الترتيب	#105	#90
الموثوقية	9.9	10.0
الاتساق	7.0	8.4
اختبارات صحيحة
معدل النجاح لكل محاولة	51.7%	50.0%
اختبارات غير مستقرة	7	4
إجمالي مرات التشغيل	60	60
التكلفة لكل نتيجة	0.000	0.687
إجمالي التكلفة	$0.000	$0.055
??? ???????	$0.000 / 1M	$0.250 / 1M
??? ???????	$0.000 / 1M	$0.750 / 1M
رموز الإخراج	1,663	4,015
رموز الاستدلال	116,522	58,382
زمن الاستجابة (المتوسط)	39.91s	2.27s
زمن الاستجابة (الحد الأقصى)	309.02s	14.63s
زمن الاستجابة (الإجمالي)	798.21s	43.15s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	8.7	7.9	91.7%	1		10.00s	98	4,666
Mercury 2	6.9	9.9	50.0%	0		1.12s	2,546	2,609

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	4.1	5.1	33.3%	1		79.17s	358	30,138
Mercury 2	7.2	6.5	66.7%	1		2.29s	270	8,514

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	3.0	10.0	0.0%	0		47.38s	465	7,265
Mercury 2	10.0	10.0	100.0%	0		3.28s	268	4,887

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	6.3	5.8	66.7%	1		17.36s	275	5,591
Mercury 2	7.3	5.9	83.3%	1		1.11s	183	1,656

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	2.9	4.4	22.2%	2		128.15s	10	49,454
Mercury 2	2.9	7.2	11.1%	1		6.48s	41	30,754

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	4.2	9.9	0.0%	0		23.23s	76	3,782
Mercury 2	4.8	10.0	0.0%	0		821ms	137	542

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	9.8	10.0	100.0%	0		11.60s	64	2,842
Mercury 2	10.0	10.0	100.0%	0		1.07s	14	958

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	3.5	4.4	33.3%	2		12.91s	175	5,627
Mercury 2	3.8	7.3	22.2%	1		934ms	354	2,758

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	10.0	10.0	100.0%	0		11.19s	133	294
Mercury 2	10.0	10.0	100.0%	0		1.89s	180	1,956

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	3.0	10.0	0.0%	0		36.98s	9	6,863
Mercury 2	3.0	10.0	0.0%	0		2.58s	22	3,748

مقارنة سريعة

تبديل زوج المقارنة

Cobuddymediumمتاح مجانًاvsOwl Alphanone Cobuddymediumمتاح مجانًاvsQwen3.6 27Bnone Cobuddymediumمتاح مجانًاvsQwen3.5-27Bnone Cobuddymediumمتاح مجانًاvsMiMo-V2-Pronone Mercury 2mediumvsGLM 5none Cobuddymediumمتاح مجانًاvsQwen3.5-35B-A3Bnone Cobuddymediumمتاح مجانًاvsQwen3.5 Plus 2026-04-20none Gemma 4 26B A4Bnoneمتاح مجانًاvsMercury 2medium Gemini 2.5 FlashnonevsMercury 2medium Mercury 2mediumvsMiMo-V2-Omninone Cobuddymediumمتاح مجانًاvsGLM 4.7 Flashnone Mercury 2mediumvsQwen3.5 Plus 2026-02-15none