AI BENCHY Compare

Laguna Xs.2 vs Qwen: Qwen3.5-122B-A10B

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-29

المقياس	Laguna Xs.2 Laguna Xs.2 medium الإصدار: 2026-04-28 متاح مجانًا	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none الإصدار: 2026-02-24

المقياس	Laguna Xs.2 Laguna Xs.2 medium الإصدار: 2026-04-28 متاح مجانًا	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none الإصدار: 2026-02-24
النتيجة	6.2	5.7
الترتيب	#80	#93
الموثوقية	10.0	غير متاح
الاتساق	6.9	9.2
اختبارات صحيحة
معدل النجاح لكل محاولة	57.4%	38.9%
اختبارات غير مستقرة	7	2
إجمالي مرات التشغيل	54	54
التكلفة لكل نتيجة	0.000	0.360
إجمالي التكلفة	$0.000	$0.022
??? ???????	$0.000 / 1M	$0.260 / 1M
??? ???????	$0.000 / 1M	$2.080 / 1M
رموز الإخراج	58,141	3,341
رموز الاستدلال	0	0
زمن الاستجابة (المتوسط)	6.03s	3.69s
زمن الاستجابة (الحد الأقصى)	29.11s	46.00s
زمن الاستجابة (الإجمالي)	108.59s	66.50s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Laguna Xs.2	7.4	5.9	83.3%	2		2.60s	5,283	0
Qwen3.5-122B-A10B	4.8	10.0	25.0%	0		1.59s	312	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Laguna Xs.2	6.3	3.7	33.3%	1		14.36s	7,896	0
Qwen3.5-122B-A10B	4.3	1.1	66.7%	1		3.44s	659	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Laguna Xs.2	3.0	10.0	0.0%	0		15.92s	8,501	0
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		46.00s	1,137	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Laguna Xs.2	7.1	5.6	83.3%	1		9.34s	10,472	0
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		1.01s	243	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Laguna Xs.2	4.1	4.4	44.5%	2		11.12s	18,712	0
Qwen3.5-122B-A10B	5.3	10.0	33.3%	0		465ms	15	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Laguna Xs.2	4.1	10.0	0.0%	0		2.76s	1,421	0
Qwen3.5-122B-A10B	5.0	10.0	0.0%	0		1.12s	66	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Laguna Xs.2	10.0	10.0	100.0%	0		1.68s	1,517	0
Qwen3.5-122B-A10B	4.5	6.8	16.7%	1		585ms	70	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Laguna Xs.2	5.3	10.0	33.3%	0		2.12s	3,168	0
Qwen3.5-122B-A10B	5.4	10.0	33.3%	0		982ms	575	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Laguna Xs.2	4.7	1.6	66.7%	1		3.39s	1,171	0
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		2.04s	264	0

مقارنة سريعة

تبديل زوج المقارنة

Gemini 2.5 FlashnonevsLaguna Xs.2mediumمتاح مجانًا Seed-2.0-LitenonevsLaguna Xs.2mediumمتاح مجانًا Gemma 4 26B A4Bnoneمتاح مجانًاvsLaguna Xs.2mediumمتاح مجانًا Laguna Xs.2mediumمتاح مجانًاvsQwen3.5-35B-A3Bnone MiniMax M2.5mediumمتاح مجانًاvsQwen3.5-122B-A10Bnone Laguna Xs.2mediumمتاح مجانًاvsQwen3.5-Flashnone Laguna Xs.2mediumمتاح مجانًاvsGLM 5V Turbonone Mistral Small 4mediumvsQwen3.5-122B-A10Bnone DeepSeek V4 PrononevsLaguna Xs.2mediumمتاح مجانًا Laguna Xs.2mediumمتاح مجانًاvsQwen3.6 27Bnone gpt-oss-120bmediumمتاح مجانًاvsQwen3.5-122B-A10Bnone DeepSeek V3.2nonevsLaguna Xs.2mediumمتاح مجانًا