AI BENCHY Compare

Cobuddy vs OpenAI: GPT-5.4

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-06

المقياس	Cobuddy Cobuddy medium الإصدار: 2026-05-06 متاح مجانًا	GPT-5.4 GPT-5.4 none الإصدار: 2026-03-05

المقياس	Cobuddy Cobuddy medium الإصدار: 2026-05-06 متاح مجانًا	GPT-5.4 GPT-5.4 none الإصدار: 2026-03-05
النتيجة	6.0	5.9
الترتيب	#90	#92
الموثوقية	9.9	غير متاح
الاتساق	6.7	9.1
اختبارات صحيحة
معدل النجاح لكل محاولة	57.4%	42.6%
اختبارات غير مستقرة	7	2
إجمالي مرات التشغيل	54	54
التكلفة لكل نتيجة	0.000	1.477
إجمالي التكلفة	$0.000	$0.104
??? ???????	$0.000 / 1M	$2.500 / 1M
??? ???????	$0.000 / 1M	$15.000 / 1M
رموز الإخراج	1,639	2,317
رموز الاستدلال	89,199	0
زمن الاستجابة (المتوسط)	36.47s	1.51s
زمن الاستجابة (الحد الأقصى)	309.02s	2.95s
زمن الاستجابة (الإجمالي)	656.47s	27.21s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	8.7	7.9	91.7%	1		10.00s	98	4,666
GPT-5.4	3.2	8.0	8.3%	1		1.21s	406	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	4.3	1.1	66.7%	1		53.59s	343	9,678
GPT-5.4	10.0	10.0	100.0%	0		2.95s	480	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	3.0	10.0	0.0%	0		47.38s	465	7,265
GPT-5.4	3.0	10.0	0.0%	0		2.89s	291	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	6.3	5.8	66.7%	1		17.36s	275	5,591
GPT-5.4	10.0	10.0	100.0%	0		1.04s	222	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	2.9	4.4	22.2%	2		128.15s	10	49,454
GPT-5.4	5.3	7.2	44.4%	1		1.07s	50	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	4.2	9.9	0.0%	0		23.23s	76	3,782
GPT-5.4	4.4	9.9	0.0%	0		1.78s	184	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	9.8	10.0	100.0%	0		11.60s	64	2,842
GPT-5.4	6.5	10.0	50.0%	0		1.07s	81	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	3.5	4.4	33.3%	2		12.91s	175	5,627
GPT-5.4	5.6	9.8	33.3%	0		1.52s	357	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Cobuddy	10.0	10.0	100.0%	0		11.19s	133	294
GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0

مقارنة سريعة

تبديل زوج المقارنة

Cobuddymediumمتاح مجانًاvsOwl Alphanone Cobuddymediumمتاح مجانًاvsMiMo-V2-Pronone Cobuddymediumمتاح مجانًاvsGLM 4.7 Flashnone Cobuddymediumمتاح مجانًاvsQwen3.5-27Bnone Cobuddymediumمتاح مجانًاvsQwen3.6 27Bnone Cobuddymediumمتاح مجانًاvsQwen3.5-35B-A3Bnone Cobuddymediumمتاح مجانًاvsKimi K2.6none Cobuddymediumمتاح مجانًاvsGLM 5.1none Cobuddymediumمتاح مجانًاvsQwen3.5 Plus 2026-04-20none Cobuddymediumمتاح مجانًاvsDeepSeek V3.2none Cobuddymediumمتاح مجانًاvsMiMo-V2.5-Pronone Cobuddymediumمتاح مجانًاvsQwen3.6 Flashnone