قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 3.1 Flash Lite Preview

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس	DeepSeek: DeepSeek V3.2 none الإصدار: 2025-12-01	Google: Gemini 3.1 Flash Lite Preview medium الإصدار: 2026-03-03
الترتيب	#39	#20
متوسط الدرجة	4.70	6.91
الاتساق	8.19	10.00
التكلفة لكل نتيجة	0.132	0.392
إجمالي التكلفة	$0.007	$0.032
اختبارات صحيحة
معدل النجاح لكل محاولة	47.6%	57.1%
اختبارات غير مستقرة	3	0
رموز الإخراج	4,869	1,308
رموز الاستدلال	0	16,986

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	1.00	9.68	0.0%	0		1,411	0
Google: Gemini 3.1 Flash Lite Preview	9.00	9.99	66.7%	0		564	3,780

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	5.38	5.81	66.7%	1		1,710	0
Google: Gemini 3.1 Flash Lite Preview	9.88	10.00	100.0%	0		279	2,952

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	1.00	7.21	22.2%	1		24	0
Google: Gemini 3.1 Flash Lite Preview	1.00	10.00	0.0%	0		18	5,325

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	8.00	9.99	50.0%	0		66	0
Google: Gemini 3.1 Flash Lite Preview	8.00	9.99	50.0%	0		72	2,121

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	7.67	7.49	88.9%	1		1,136	0
Google: Gemini 3.1 Flash Lite Preview	7.00	10.00	66.7%	0		141	1,896

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	10.00	10.00	100.0%	0		522	0
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		234	912

مقارنة سريعة

تبديل زوج المقارنة

Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.3 Chatnone Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone DeepSeek V3.2nonevsGLM 4.7 Flashmedium Claude Sonnet 4.6nonevsGemini 3.1 Flash Lite Previewmedium Gemini 3.1 Flash Lite PreviewmediumvsQwen3.5 Plus 2026-02-15none Gemini 3.1 Flash Lite PreviewmediumvsGLM 5none DeepSeek V3.2nonevsMiniMax M2.5medium DeepSeek V3.2nonevsgpt-oss-120bmediumمتاح مجانًا DeepSeek V3.2nonevsGPT-5 Minimedium DeepSeek V3.2nonevsQwen3.5-Flashmedium DeepSeek V3.2nonevsGPT-5 Nanomedium DeepSeek V3.2nonevsQwen3 Coder Nextmedium