قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 2.5 Flash

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس	DeepSeek: DeepSeek V3.2 medium الإصدار: 2025-12-01	Google: Gemini 2.5 Flash medium الإصدار: 2025-06-17
الترتيب	#18	#16
متوسط الدرجة	6.98	7.05
الاتساق	8.75	9.39
التكلفة لكل نتيجة	0.193	2.762
إجمالي التكلفة	$0.018	$0.249
اختبارات صحيحة
معدل النجاح لكل محاولة	71.4%	69.1%
اختبارات غير مستقرة	2	1
رموز الإخراج	6,753	975
رموز الاستدلال	30,427	96,701

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	7.00	9.86	66.7%	0		1,171	4,893
Google: Gemini 2.5 Flash	7.33	10.00	66.7%	0		249	8,832

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	9.88	10.00	100.0%	0		207	7,693
Google: Gemini 2.5 Flash	9.88	10.00	100.0%	0		279	2,325

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	4.00	7.21	44.4%	1		3,081	7,856
Google: Gemini 2.5 Flash	4.00	7.21	55.6%	1		18	80,702

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	7.00	9.84	50.0%	0		1,397	2,845
Google: Gemini 2.5 Flash	7.00	9.91	50.0%	0		69	1,203

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	7.00	7.21	88.9%	1		390	6,281
Google: Gemini 2.5 Flash	7.00	10.00	66.7%	0		126	2,499

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	10.00	10.00	100.0%	0		507	859
Google: Gemini 2.5 Flash	10.00	10.00	100.0%	0		234	1,140

مقارنة سريعة

تبديل زوج المقارنة

Gemini 2.5 FlashmediumvsGPT-5.3 Chatnone DeepSeek V3.2mediumvsGemini 3 Flash Previewnone DeepSeek V3.2mediumvsGPT-5.3 Chatnone Gemini 2.5 FlashmediumvsGPT-5.2 Chatnone DeepSeek V3.2mediumvsGPT-5.2 Chatnone Claude Sonnet 4.6nonevsDeepSeek V3.2medium DeepSeek V3.2mediumvsQwen3.5 Plus 2026-02-15none Claude Sonnet 4.6nonevsGemini 2.5 Flashmedium DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewnone Gemini 2.5 FlashmediumvsQwen3.5 Plus 2026-02-15none DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewhigh DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewlow