قارن الرسوم البيانية المنهجية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs Qwen: Qwen3 Coder Next

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-06

المقياس	Trinity Large Preview none الإصدار: 2026-01-27 متاح مجانًا	Qwen: Qwen3 Coder Next none الإصدار: 2026-02-03
الترتيب	#45	#48
متوسط الدرجة	4.2	4.0
الاتساق	9.6	10.0
التكلفة لكل نتيجة	0.000	0.174
إجمالي التكلفة	$0.000	$0.007
اختبارات صحيحة
معدل النجاح لكل محاولة	33.3%	25.0%
اختبارات غير مستقرة	1	0
إجمالي مرات التشغيل	48 (16 x 3)	48 (16 x 3)
رموز الإخراج	1,837	3,026
رموز الاستدلال	0	0
زمن الاستجابة (المتوسط)	3.15s	11.68s
زمن الاستجابة (الحد الأقصى)	8.91s	45.14s
زمن الاستجابة (الإجمالي)	50.46s	116.76s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

متوسط الدرجة vs زمن الاستجابة (المتوسط)

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
Qwen: Qwen3 Coder Next	2.3	10.0	0.0%	0		4.39s	1,315	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
Qwen: Qwen3 Coder Next	10.0	10.0	0.0%	0		45.14s	317	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
Qwen: Qwen3 Coder Next	5.4	10.0	50.0%	0		1.32s	246	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
Qwen: Qwen3 Coder Next	4.0	10.0	33.3%	0		962ms	26	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
Qwen: Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	152	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
Qwen: Qwen3 Coder Next	4.5	10.0	0.0%	0		7.71s	63	0

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
Qwen: Qwen3 Coder Next	1.3	10.0	0.0%	0		22.86s	652	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
Qwen: Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	255	0

مقارنة سريعة

تبديل زوج المقارنة

Trinity Large Previewnoneمتاح مجانًاvsMiniMax M2.5medium MiniMax M2.5mediumvsQwen3 Coder Nextnone Trinity Large Previewnoneمتاح مجانًاvsQwen3 Coder Nextmedium Trinity Large Previewnoneمتاح مجانًاvsgpt-oss-120bmediumمتاح مجانًا Qwen3 Coder NextnonevsGLM 4.7 Flashmedium Trinity Large Previewnoneمتاح مجانًاvsMercury 2medium gpt-oss-120bmediumمتاح مجانًاvsQwen3 Coder Nextnone Trinity Large Previewnoneمتاح مجانًاvsGLM 4.7 Flashmedium Trinity Large Previewnoneمتاح مجانًاvsQwen3.5-35B-A3Bmedium Trinity Large Previewnoneمتاح مجانًاvsGPT-5 Nanomedium Mercury 2mediumvsQwen3 Coder Nextnone GPT-5 NanomediumvsQwen3 Coder Nextnone