AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 3.5 Flash

الملخص

مقارنة benchmark بين DeepSeek V3.2 و Gemini 3.5 Flash: يتقدم DeepSeek V3.2 في متوسط النتيجة بـ 7.5 مقابل 7.0. لدى DeepSeek V3.2 تكلفة benchmark أقل عند $0.044 مقابل $1.079. Gemini 3.5 Flash أسرع عند 9.93s مقابل 68.71s، مع معدلات نجاح 65.1% مقابل 77.8%.

النموذج الموصى به: DeepSeek V3.2 - It has the best score here (7.5), while costing about 24.6x less than Gemini 3.5 Flash.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس	DeepSeek V3.2 DeepSeek V3.2 medium الإصدار: 2025-12-01	Gemini 3.5 Flash Gemini 3.5 Flash none الإصدار: 2026-05-19

المقياس	DeepSeek V3.2 DeepSeek V3.2 medium الإصدار: 2025-12-01	Gemini 3.5 Flash Gemini 3.5 Flash none الإصدار: 2026-05-19
النتيجة	7.5	7.0
الترتيب	#48	#66
الموثوقية	10.0	10.0
الاتساق	7.6	8.9
اختبارات صحيحة
معدل النجاح لكل محاولة	65.1%	77.8%
اختبارات غير مستقرة	6	3
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	0.436	7.190
إجمالي التكلفة	$0.044	$1.079
سعر الإدخال	$0.229 / 1M	$1.500 / 1M
سعر الإخراج	$0.344 / 1M	$9.000 / 1M
إجمالي رموز الإدخال	38,333	13,843
رموز الإخراج	7,186	117,518
رموز الاستدلال	99,081	0
زمن الاستجابة (المتوسط)	68.71s	9.93s
زمن الاستجابة (الحد الأقصى)	376.10s	64.36s
زمن الاستجابة (الإجمالي)	1442.81s	178.68s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#48 DeepSeek V3.2

medium

التكلفة: $0.001
الوقت: 53.6s
الرموز: 1,932 tok

#66 Gemini 3.5 Flash

none

التكلفة: $0.225
الوقت: 125.5s
الرموز: 25,004 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	8.2	7.9	83.3%	1		24.23s	448	3,247	6,953
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.53s	492	5,101	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	6.0	7.2	55.6%	1		248.68s	5,717	649	52,014
Gemini 3.5 Flash	8.8	7.8	88.9%	1		34.69s	8,122	75,927	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		93.11s	14,283	571	6,296
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	7,388	207	7,693
Gemini 3.5 Flash	6.5	10.0	50.0%	0		8.10s	2,781	5,895	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	2.9	4.4	22.2%	2		24.27s	472	21	6,838
Gemini 3.5 Flash	7.6	7.2	77.8%	1		10.64s	633	17,910	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	3.4	2.5	33.3%	1		58.29s	314	49	2,189
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.46s	486	1,620	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	627	1,397	2,845
Gemini 3.5 Flash	9.8	10.0	100.0%	0		3.38s	615	3,928	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	7.0	7.2	55.6%	1		37.69s	594	518	6,375
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.13s	558	4,640	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	8,307	507	859
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	3.0	10.0	0.0%	0		83.99s	183	20	7,019
Gemini 3.5 Flash	2.8	1.6	33.3%	1		4.87s	156	2,497	0

مقارنة سريعة

تبديل زوج المقارنة

Gemini 3.5 FlashnonevsKimi K2.7 Codemedium DeepSeek V3.2mediumvsGPT-5.3 Chatnone DeepSeek V3.2mediumvsGemini 3 Flash Previewlow Gemini 3.5 FlashnonevsGLM 5.1medium Gemini 3.5 FlashnonevsStep 3.7 Flashhigh Gemini 3.5 FlashnonevsQwen3.5-Flashmedium Claude Sonnet 4.6nonevsDeepSeek V3.2medium Gemini 3.5 FlashnonevsRing-2.6-1Tmedium Claude Opus 4.8nonevsDeepSeek V3.2medium DeepSeek V3.2mediumvsStep 3.7 Flashlow Gemini 3.5 FlashnonevsQwen3.6 35B A3Bmedium Gemini 3.5 FlashnonevsMiMo-V2.5medium