AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Laguna Xs.2

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-29

المقياس	DeepSeek V3.2 DeepSeek V3.2 none الإصدار: 2025-12-01	Laguna Xs.2 Laguna Xs.2 medium الإصدار: 2026-04-28 متاح مجانًا

المقياس	DeepSeek V3.2 DeepSeek V3.2 none الإصدار: 2025-12-01	Laguna Xs.2 Laguna Xs.2 medium الإصدار: 2026-04-28 متاح مجانًا
النتيجة	6.0	6.2
الترتيب	#84	#81
الموثوقية	غير متاح	10.0
الاتساق	8.6	6.9
اختبارات صحيحة
معدل النجاح لكل محاولة	46.3%	57.4%
اختبارات غير مستقرة	3	7
إجمالي مرات التشغيل	52	54
التكلفة لكل نتيجة	0.225	0.000
إجمالي التكلفة	$0.016	$0.000
??? ???????	$0.252 / 1M	$0.000 / 1M
??? ???????	$0.378 / 1M	$0.000 / 1M
رموز الإخراج	8,378	58,141
رموز الاستدلال	0	0
زمن الاستجابة (المتوسط)	12.07s	6.03s
زمن الاستجابة (الحد الأقصى)	115.89s	29.11s
زمن الاستجابة (الإجمالي)	217.28s	108.59s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	3.2	9.8	0.0%	0		7.63s	1,419	0
Laguna Xs.2	7.4	5.9	83.3%	2		2.60s	5,283	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	2.4	1.3	33.3%	1		7.63s	553	0
Laguna Xs.2	6.3	3.7	33.3%	1		14.36s	7,896	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
Laguna Xs.2	3.0	10.0	0.0%	0		15.92s	8,501	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
Laguna Xs.2	7.1	5.6	83.3%	1		9.34s	10,472	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	3.0	10.0	0.0%	0		1.52s	18	0
Laguna Xs.2	4.1	4.4	44.5%	2		11.12s	18,712	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		2.86s	67	0
Laguna Xs.2	4.1	10.0	0.0%	0		2.76s	1,421	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
Laguna Xs.2	10.0	10.0	100.0%	0		1.68s	1,517	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	8.5	7.5	88.9%	1		7.37s	1,136	0
Laguna Xs.2	5.3	10.0	33.3%	0		2.12s	3,168	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
Laguna Xs.2	4.7	1.6	66.7%	1		3.39s	1,171	0

مقارنة سريعة

تبديل زوج المقارنة

Gemini 2.5 FlashnonevsLaguna Xs.2mediumمتاح مجانًا Seed-2.0-LitenonevsLaguna Xs.2mediumمتاح مجانًا Gemma 4 26B A4Bnoneمتاح مجانًاvsLaguna Xs.2mediumمتاح مجانًا Laguna Xs.2mediumمتاح مجانًاvsQwen3.5-35B-A3Bnone Laguna Xs.2mediumمتاح مجانًاvsQwen3.5-Flashnone Laguna Xs.2mediumمتاح مجانًاvsGLM 5V Turbonone Laguna Xs.2mediumمتاح مجانًاvsQwen3.6 27Bnone Laguna Xs.2mediumمتاح مجانًاvsMiMo-V2-Pronone DeepSeek V3.2nonevsgpt-oss-120bmediumمتاح مجانًا DeepSeek V3.2nonevsGPT-5 Nanomedium GPT-5.4nonevsLaguna Xs.2mediumمتاح مجانًا Laguna Xs.2mediumمتاح مجانًاvsQwen3.5-27Bnone