قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

Arcee AI: Trinity Large Preview (free) vs OpenAI: GPT-5 Mini

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس	Arcee AI: Trinity Large Preview (free) none الإصدار: 2026-01-27 متاح مجانًا	OpenAI: GPT-5 Mini medium الإصدار: 2025-08-07
الترتيب	#42	#33
متوسط الدرجة	4.34	5.77
الاتساق	9.97	8.79
التكلفة لكل نتيجة	0.000	1.200
إجمالي التكلفة	$0.000	$0.084
اختبارات صحيحة
معدل النجاح لكل محاولة	35.7%	57.1%
اختبارات غير مستقرة	0	2
رموز الإخراج	1,415	4,723
رموز الاستدلال	0	35,392

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	1.00	10.00	0.0%	0		587	0
OpenAI: GPT-5 Mini	7.00	9.62	66.7%	0		1,645	5,824

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	9.88	10.00	100.0%	0		186	0
OpenAI: GPT-5 Mini	9.88	10.00	100.0%	0		453	3,200

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	4.00	10.00	33.3%	0		21	0
OpenAI: GPT-5 Mini	1.00	7.21	22.2%	1		293	14,016

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	2.00	9.79	0.0%	0		63	0
OpenAI: GPT-5 Mini	7.00	6.64	66.7%	1		318	4,992

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	4.00	9.99	33.3%	0		291	0
OpenAI: GPT-5 Mini	4.33	9.78	33.3%	0		1,527	5,760

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Arcee AI: Trinity Large Preview (free)	10.00	10.00	100.0%	0		267	0
OpenAI: GPT-5 Mini	10.00	10.00	100.0%	0		487	1,600

مقارنة سريعة

تبديل زوج المقارنة

Trinity Large Preview (free)noneمتاح مجانًاvsGLM 4.7 Flashmedium GPT-5 MinimediumvsGLM 5none Gemini 2.5 FlashnonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none GPT-5 MinimediumvsQwen3.5-122B-A10Bnone Claude Sonnet 4.6nonevsGPT-5 Minimedium Trinity Large Preview (free)noneمتاح مجانًاvsQwen3 Coder Nextmedium DeepSeek V3.2nonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-27Bnone GPT-5 MinimediumvsQwen3.5-35B-A3Bnone Trinity Large Preview (free)noneمتاح مجانًاvsMiniMax M2.5medium Trinity Large Preview (free)noneمتاح مجانًاvsgpt-oss-120bmediumمتاح مجانًا