قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

Arcee AI: Trinity Large Preview (free) vs OpenAI: GPT-5.4

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-05

المقياس	Arcee AI: Trinity Large Preview (free) none الإصدار: 2026-01-27 متاح مجانًا	OpenAI: GPT-5.4 none الإصدار: 2026-03-05
الترتيب	#45	#44
متوسط الدرجة	4.3	4.6
اختبارات صحيحة
الاتساق	9.6	8.9
التكلفة لكل نتيجة	0.000	1.496
إجمالي التكلفة	$0.000	$0.090
معدل النجاح لكل محاولة	35.6%	44.4%
اختبارات غير مستقرة	1	2
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
رموز الإخراج	1,713	1,635
رموز الاستدلال	0	0
زمن الاستجابة (المتوسط)	3.17s	1.46s
زمن الاستجابة (الحد الأقصى)	8.91s	2.89s
زمن الاستجابة (الإجمالي)	47.61s	21.86s

أفضل النماذج حسب الدرجة

زمن الاستجابة (المتوسط)

الدرجة مقابل التكلفة الإجمالية

متوسط الدرجة vs زمن الاستجابة (المتوسط)

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	10.0	10.0	0.0%	0		3.59s	587	0
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	10.0	10.0	0.0%	0		8.91s	294	0
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	9.9	10.0	100.0%	0		3.26s	186	0
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	4.0	10.0	33.3%	0		877ms	25	0
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	3.5	6.7	16.7%	1		1.09s	63	0
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	4.0	10.0	33.3%	0		3.30s	291	0
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	10.0	10.0	100.0%	0		6.67s	267	0
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0

مقارنة سريعة

تبديل زوج المقارنة

MiniMax M2.5mediumvsGPT-5.4none Trinity Large Preview (free)noneمتاح مجانًاvsMiniMax M2.5medium Mercury 2mediumvsGPT-5.4none Trinity Large Preview (free)noneمتاح مجانًاvsgpt-oss-120bmediumمتاح مجانًا Trinity Large Preview (free)noneمتاح مجانًاvsQwen3 Coder Nextmedium Trinity Large Preview (free)noneمتاح مجانًاvsGLM 4.7 Flashmedium Trinity Large Preview (free)noneمتاح مجانًاvsMercury 2medium GPT-5.4nonevsQwen3.5-35B-A3Bmedium GPT-5.4nonevsQwen3 Coder Nextmedium GPT-5.4nonevsGLM 4.7 Flashmedium Trinity Large Preview (free)noneمتاح مجانًاvsGPT-5 Nanomedium Trinity Large Preview (free)noneمتاح مجانًاvsQwen3.5-35B-A3Bmedium