قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

Arcee AI: Trinity Large Preview (free) vs Inception: Mercury 2

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-05

المقياس	Arcee AI: Trinity Large Preview (free) none الإصدار: 2026-01-27 متاح مجانًا	Inception: Mercury 2 medium الإصدار: 2026-02-24
الترتيب	#45	#35
متوسط الدرجة	43	54
الاتساق	96	83
التكلفة لكل نتيجة	0.000	0.622
إجمالي التكلفة	$0.000	$0.044
زمن الاستجابة (المتوسط)	3.17s	2.47s
زمن الاستجابة (الحد الأقصى)	8.91s	14.63s
زمن الاستجابة (الإجمالي)	47.61s	34.56s
اختبارات صحيحة
معدل النجاح لكل محاولة	35.6%	57.8%
اختبارات غير مستقرة	1	3
رموز الإخراج	1,713	3,571
رموز الاستدلال	0	45,379

أفضل النماذج حسب الدرجة

زمن الاستجابة (المتوسط)

الدرجة مقابل التكلفة الإجمالية

متوسط الدرجة vs زمن الاستجابة (المتوسط)

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	100	100	0.0%	0		3.59s	587	0
Inception: Mercury 2	73	98	66.7%	0		1.30s	2,531	2,410

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	100	100	0.0%	0		8.91s	294	0
Inception: Mercury 2	100	100	100.0%	0		3.28s	268	4,887

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	99	100	100.0%	0		3.26s	186	0
Inception: Mercury 2	55	59	83.3%	1		1.11s	183	1,656

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	40	100	33.3%	0		877ms	25	0
Inception: Mercury 2	100	72	11.1%	1		6.48s	41	30,754

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	35	67	16.7%	1		1.09s	63	0
Inception: Mercury 2	100	100	100.0%	0		1.07s	14	958

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	40	100	33.3%	0		3.30s	291	0
Inception: Mercury 2	17	75	22.2%	1		934ms	354	2,758

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	100	100	100.0%	0		6.67s	267	0
Inception: Mercury 2	100	100	100.0%	0		1.89s	180	1,956

مقارنة سريعة

تبديل زوج المقارنة

Gemini 2.5 FlashnonevsMercury 2medium DeepSeek V3.2nonevsMercury 2medium Mercury 2mediumvsQwen3.5-122B-A10Bnone Mercury 2mediumvsGLM 5none Trinity Large Preview (free)noneمتاح مجانًاvsMiniMax M2.5medium Mercury 2mediumvsQwen3.5-Flashnone Mercury 2mediumvsQwen3.5-27Bnone Mercury 2mediumvsQwen3.5-35B-A3Bnone Mercury 2mediumvsGPT-5.4none Trinity Large Preview (free)noneمتاح مجانًاvsgpt-oss-120bmediumمتاح مجانًا Trinity Large Preview (free)noneمتاح مجانًاvsQwen3 Coder Nextmedium Trinity Large Preview (free)noneمتاح مجانًاvsGLM 4.7 Flashmedium