AI BENCHY Compare

Poolside: Laguna XS 2.1 vs Qwen: Qwen3.7 Plus

الملخص

مقارنة benchmark بين Laguna XS 2.1 و Qwen3.7 Plus: يتقدم Qwen3.7 Plus في متوسط النتيجة بـ 7.2 مقابل 7.0. لدى Qwen3.7 Plus تكلفة benchmark أقل عند $0.023 مقابل $0.036. Qwen3.7 Plus أسرع عند 2.85s مقابل 30.08s، مع معدلات نجاح 44.4% مقابل 47.6%.

النموذج الموصى به: Qwen3.7 Plus - It has the best score here (7.2), while costing about 1.6x less than Laguna XS 2.1.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-02

المقياس	Laguna XS 2.1 Laguna XS 2.1 medium الإصدار: 2026-07-02 متاح مجانًا	Qwen3.7 Plus Qwen3.7 Plus none الإصدار: 2026-06-03

المقياس	Laguna XS 2.1 Laguna XS 2.1 medium الإصدار: 2026-07-02 متاح مجانًا	Qwen3.7 Plus Qwen3.7 Plus none الإصدار: 2026-06-03
النتيجة	7.0	7.2
الترتيب	#67	#62
الموثوقية	10.0	10.0
الاتساق	9.6	10.0
اختبارات صحيحة
معدل النجاح لكل محاولة	44.4%	47.6%
اختبارات غير مستقرة	1	0
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	0.392	0.276
إجمالي التكلفة	$0.036	$0.023
سعر الإدخال	$0.060 / 1M	$0.320 / 1M
سعر الإخراج	$0.120 / 1M	$1.280 / 1M
إجمالي رموز الإدخال	45,324	42,510
رموز الإخراج	25,761	6,578
رموز الاستدلال	268,677	0
زمن الاستجابة (المتوسط)	30.08s	2.85s
زمن الاستجابة (الحد الأقصى)	155.23s	29.38s
زمن الاستجابة (الإجمالي)	631.77s	59.86s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#67 Laguna XS 2.1

medium

التكلفة: $0.001
الوقت: 30.6s
الرموز: 4,678 tok

#62 Qwen3.7 Plus

none

التكلفة: $0.019
الوقت: 213.5s
الرموز: 11,960 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Laguna XS 2.1	4.8	10.0	25.0%	0		41.96s	774	353	73,090
Qwen3.7 Plus	6.5	10.0	50.0%	0		1.38s	696	349	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Laguna XS 2.1	5.5	10.0	33.3%	0		70.35s	7,995	23,767	83,258
Qwen3.7 Plus	5.5	10.0	33.3%	0		2.15s	7,911	639	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Laguna XS 2.1	9.6	10.0	100.0%	0		13.43s	18,033	507	5,908
Qwen3.7 Plus	10.0	10.0	100.0%	0		29.38s	14,952	4,505	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Laguna XS 2.1	10.0	10.0	100.0%	0		4.50s	7,734	234	3,129
Qwen3.7 Plus	10.0	10.0	100.0%	0		1.43s	7,794	243	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Laguna XS 2.1	2.9	7.2	11.1%	1		65.66s	834	17	91,533
Qwen3.7 Plus	3.0	10.0	0.0%	0		868ms	789	18	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Laguna XS 2.1	5.0	10.0	0.0%	0		4.15s	537	119	1,375
Qwen3.7 Plus	5.3	10.0	0.0%	0		1.33s	522	78	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Laguna XS 2.1	9.8	10.0	100.0%	0		2.57s	753	82	1,844
Qwen3.7 Plus	6.3	10.0	50.0%	0		929ms	711	72	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Laguna XS 2.1	5.3	10.0	33.3%	0		3.43s	771	357	3,355
Qwen3.7 Plus	7.7	10.0	66.7%	0		1.71s	714	443	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Laguna XS 2.1	10.0	10.0	100.0%	0		3.01s	7,638	309	748
Qwen3.7 Plus	10.0	10.0	100.0%	0		3.54s	8,211	222	0

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Laguna XS 2.1	3.0	10.0	0.0%	0		10.88s	255	16	4,437
Qwen3.7 Plus	3.0	10.0	0.0%	0		1.21s	210	9	0

مقارنة سريعة

تبديل زوج المقارنة

Gemma 4 26B A4Bmediumمتاح مجانًاvsQwen3.7 Plusnone Laguna XS 2.1mediumمتاح مجانًاvsStep 3.7 Flashhigh Gemini 3.5 FlashnonevsLaguna XS 2.1mediumمتاح مجانًا Qwen3.7 PlusnonevsStep 3.7 Flashhigh Qwen3.7 PlusnonevsGLM 5.1medium Laguna XS 2.1mediumمتاح مجانًاvsGLM 5.2none DeepSeek V4 PrononevsLaguna XS 2.1mediumمتاح مجانًا Gemini 3 Flash PreviewnonevsLaguna XS 2.1mediumمتاح مجانًا Kimi K2.7 CodemediumvsQwen3.7 Plusnone Claude Opus 4.8nonevsLaguna XS 2.1mediumمتاح مجانًا Qwen3.7 PlusnonevsGrok 4.20medium Laguna XS 2.1mediumمتاح مجانًاvsQwen3.7 Maxnone