DeepSeek: DeepSeek V3.2 vs Google: Gemini 3.1 Flash Lite

يتقدم Gemini 3.1 Flash Lite (minimal) في متوسط النتيجة بـ 6.1 مقابل 5.0. لدى Gemini 3.1 Flash Lite (minimal) تكلفة benchmark أقل عند $0.047 مقابل $0.054. Gemini 3.1 Flash Lite (minimal) أسرع عند 1.86s مقابل 18.25s، مع معدلات نجاح 37.9% مقابل 51.5%.

النموذج الموصى بهGemini 3.1 Flash Lite (minimal)It has the best score here (6.1), while responding about 9.8x faster than DeepSeek V3.2.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-17

المقياس	DeepSeek V3.2 DeepSeek V3.2 none الإصدار: 2025-12-01	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal الإصدار: 2026-05-08

المقياس	DeepSeek V3.2 DeepSeek V3.2 none الإصدار: 2025-12-01	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal الإصدار: 2026-05-08
النتيجة	5.0	6.1
الترتيب	#165	#114
الموثوقية	10.0	10.0
الاتساق	7.7	8.9
اختبارات صحيحة
معدل النجاح لكل محاولة	37.9%	51.5%
اختبارات غير مستقرة	6	3
إجمالي مرات التشغيل	66	66
التكلفة لكل نتيجة	0.870	0.465
إجمالي التكلفة	$0.054	$0.047
سعر الإدخال	$0.269 / 1M	$0.250 / 1M
سعر الإخراج	$0.400 / 1M	$1.500 / 1M
إجمالي رموز الإدخال	135,780	119,065
رموز الإخراج	42,097	11,118
رموز الاستدلال	0	0
زمن الاستجابة (المتوسط)	18.25s	1.86s
زمن الاستجابة (الحد الأقصى)	115.89s	12.97s
زمن الاستجابة (الإجمالي)	401.60s	40.88s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#165 DeepSeek V3.2

none

التكلفة: $0.002
الوقت: 7.0s
الرموز: 1,046 tok

#114 Gemini 3.1 Flash Lite

minimal

التكلفة: $0.001
الوقت: 3.7s
الرموز: 635 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

الفئة:

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	3.2	8.0	8.3%	1		9.35s	494	1,073	0
Gemini 3.1 Flash Lite	8.3	10.0	75.0%	0		1.10s	500	639	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	3.1	6.9	11.1%	1		14.54s	7,279	4,528	0
Gemini 3.1 Flash Lite	5.5	10.0	33.3%	0		831ms	8,126	666	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	4.8	10.0	0.0%	0		113.53s	109,626	33,819	0
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		7.75s	94,962	8,988	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	7,890	1,710	0
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.04s	7,552	279	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	2.9	7.2	11.1%	1		4.17s	624	21	0
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		1.02s	641	15	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	4.7	1.6	66.7%	1		9.32s	314	43	0
Gemini 3.1 Flash Lite	4.0	10.0	0.0%	0		791ms	490	63	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	627	66	0
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		932ms	615	72	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	7.6	7.2	77.8%	1		6.91s	424	298	0
Gemini 3.1 Flash Lite	6.0	4.6	66.7%	2		2.15s	564	153	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	8,319	522	0
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		3.51s	5,457	234	0

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	183	17	0
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		724ms	158	9	0

مقارنة سريعة

تبديل زوج المقارنة