AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Qwen: Qwen3.5-9B

الملخص

مقارنة benchmark بين DeepSeek V3.2 و Qwen3.5-9B: يتقدم DeepSeek V3.2 في متوسط النتيجة بـ 5.3 مقابل 3.8. لدى DeepSeek V3.2 تكلفة benchmark أقل عند $0.017 مقابل $0.036. DeepSeek V3.2 أسرع عند 13.83s مقابل 82.24s، مع معدلات نجاح 39.7% مقابل 27.0%.

النموذج الموصى به: DeepSeek V3.2 - It has the best score here (5.3), while costing about 2.1x less than Qwen3.5-9B.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس	DeepSeek V3.2 DeepSeek V3.2 none الإصدار: 2025-12-01	Qwen3.5-9B Qwen3.5-9B medium الإصدار: 2026-03-02

المقياس	DeepSeek V3.2 DeepSeek V3.2 none الإصدار: 2025-12-01	Qwen3.5-9B Qwen3.5-9B medium الإصدار: 2026-03-02
النتيجة	5.3	3.8
الترتيب	#126	#165
الموثوقية	10.0	6.7
الاتساق	7.6	8.0
اختبارات صحيحة
معدل النجاح لكل محاولة	39.7%	27.0%
اختبارات غير مستقرة	6	5
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	0.306	1.187
إجمالي التكلفة	$0.017	$0.036
سعر الإدخال	$0.229 / 1M	$0.100 / 1M
سعر الإخراج	$0.344 / 1M	$0.150 / 1M
إجمالي رموز الإدخال	55,997	17,070
رموز الإخراج	11,165	29,045
رموز الاستدلال	0	209,516
زمن الاستجابة (المتوسط)	13.83s	82.24s
زمن الاستجابة (الحد الأقصى)	115.89s	226.38s
زمن الاستجابة (الإجمالي)	290.43s	1315.88s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#126 DeepSeek V3.2

none

التكلفة: $0.002
الوقت: 7.0s
الرموز: 1,046 tok

#165 Qwen3.5-9B

medium

التكلفة: $0.001
الوقت: 35.9s
الرموز: 3,030 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	3.2	8.0	8.3%	1		9.35s	494	1,073	0
Qwen3.5-9B	5.1	5.8	50.0%	2		34.44s	369	2,621	12,411

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	3.1	6.9	11.1%	1		14.54s	7,279	4,528	0
Qwen3.5-9B	2.9	10.0	0.0%	0		100.88s	2,396	7,890	41,129

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	29,843	2,887	0
Qwen3.5-9B	3.0	10.0	0.0%	0		0ms	0	0	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	7,890	1,710	0
Qwen3.5-9B	3.6	5.6	33.3%	1		87.31s	4,722	1,383	32,113

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	2.9	7.2	11.1%	1		4.17s	624	21	0
Qwen3.5-9B	3.6	7.2	22.2%	1		137.75s	295	11,549	48,475

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	4.7	1.6	66.7%	1		9.32s	314	43	0
Qwen3.5-9B	2.8	1.6	33.3%	1		226.38s	180	0	30,695

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	627	66	0
Qwen3.5-9B	6.5	10.0	50.0%	0		5.75s	381	491	1,824

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	7.6	7.2	77.8%	1		6.91s	424	298	0
Qwen3.5-9B	3.0	10.0	0.0%	0		32.27s	376	1,593	12,026

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	8,319	522	0
Qwen3.5-9B	10.0	10.0	100.0%	0		4.31s	8,283	444	1,149

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	183	17	0
Qwen3.5-9B	3.0	10.0	0.0%	0		177.02s	68	3,074	29,694

مقارنة سريعة

تبديل زوج المقارنة

DeepSeek V3.2nonevsMiniMax M2.7medium DeepSeek V3.2nonevsMistral Small 4medium gpt-oss-120bnoneمتاح مجانًاvsQwen3.5-9Bmedium Granite 4.1 8BnonevsQwen3.5-9Bmedium CobuddymediumvsDeepSeek V3.2none DeepSeek V3.2nonevsMiniMax M2.5medium North Mini Codemediumمتاح مجانًاvsDeepSeek V3.2none Qwen3.5-9BmediumvsGrok 4.20none DeepSeek V3.2nonevsQwen3 Coder Nextmedium Mercury 2nonevsQwen3.5-9Bmedium DeepSeek V3.2nonevsGemini 3.1 Flash Liteminimal Ling-2.6-1TnonevsQwen3.5-9Bmedium