AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 3.1 Flash Lite Preview

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-16

المقياس	DeepSeek V3.2 DeepSeek V3.2 medium الإصدار: 2025-12-01	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none الإصدار: 2026-03-03

المقياس	DeepSeek V3.2 DeepSeek V3.2 medium الإصدار: 2025-12-01	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none الإصدار: 2026-03-03
النتيجة	8.0	7.9
الترتيب	#27	#29
الاتساق	8.2	9.6
اختبارات صحيحة
معدل النجاح لكل محاولة	79.6%	70.4%
اختبارات غير مستقرة	4	1
إجمالي مرات التشغيل	54	54
التكلفة لكل نتيجة	0.240	0.130
إجمالي التكلفة	$0.029	$0.016
??? ???????	$0.260 / 1M	$0.250 / 1M
??? ???????	$0.380 / 1M	$1.500 / 1M
رموز الإخراج	10,620	5,361
رموز الاستدلال	48,511	0
زمن الاستجابة (المتوسط)	46.41s	1.30s
زمن الاستجابة (الحد الأقصى)	180.92s	3.39s
زمن الاستجابة (الإجمالي)	835.33s	23.42s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	8.4	9.9	75.0%	0		30.72s	3,773	7,523
Gemini 3.1 Flash Lite Preview	7.5	8.4	66.7%	1		1.04s	1,092	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	4.7	1.6	66.7%	1		180.92s	626	6,792
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.47s	640	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		93.11s	571	6,296
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		3.20s	339	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	207	7,693
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.22s	399	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	5.3	7.2	44.4%	1		39.32s	3,081	7,856
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		942ms	568	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	5.4	2.5	66.7%	1		31.30s	68	2,366
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		741ms	69	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	1,397	2,845
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.13s	574	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	8.2	7.2	88.9%	1		36.87s	390	6,281
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		972ms	898	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	507	859
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.39s	782	0

مقارنة سريعة

تبديل زوج المقارنة

Gemini 3.1 Flash Lite PreviewnonevsStep 3.5 Flashmedium DeepSeek V3.2mediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewnonevsGLM 5V Turbomedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-Flashmedium Gemini 3.1 Flash Lite PreviewnonevsGLM 5.1medium DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewlow Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewnone DeepSeek V3.2mediumvsGemini 3 Flash Previewnone Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2-Promedium Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2-Omnimedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.6 Plusmedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-122B-A10Bmedium