قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 2.5 Flash

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس	DeepSeek: DeepSeek V3.2 none الإصدار: 2025-12-01	Google: Gemini 2.5 Flash medium الإصدار: 2025-06-17
الترتيب	#39	#16
متوسط الدرجة	4.70	7.05
الاتساق	8.19	9.39
التكلفة لكل نتيجة	0.132	2.762
إجمالي التكلفة	$0.007	$0.249
اختبارات صحيحة
معدل النجاح لكل محاولة	47.6%	69.1%
اختبارات غير مستقرة	3	1
رموز الإخراج	4,869	975
رموز الاستدلال	0	96,701

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	1.00	9.68	0.0%	0		1,411	0
Google: Gemini 2.5 Flash	7.33	10.00	66.7%	0		249	8,832

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	5.38	5.81	66.7%	1		1,710	0
Google: Gemini 2.5 Flash	9.88	10.00	100.0%	0		279	2,325

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	1.00	7.21	22.2%	1		24	0
Google: Gemini 2.5 Flash	4.00	7.21	55.6%	1		18	80,702

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	8.00	9.99	50.0%	0		66	0
Google: Gemini 2.5 Flash	7.00	9.91	50.0%	0		69	1,203

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	7.67	7.49	88.9%	1		1,136	0
Google: Gemini 2.5 Flash	7.00	10.00	66.7%	0		126	2,499

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	10.00	10.00	100.0%	0		522	0
Google: Gemini 2.5 Flash	10.00	10.00	100.0%	0		234	1,140

مقارنة سريعة

تبديل زوج المقارنة

Gemini 2.5 FlashmediumvsGPT-5.3 Chatnone Gemini 2.5 FlashmediumvsGPT-5.2 Chatnone DeepSeek V3.2nonevsGLM 4.7 Flashmedium Claude Sonnet 4.6nonevsGemini 2.5 Flashmedium Gemini 2.5 FlashmediumvsQwen3.5 Plus 2026-02-15none DeepSeek V3.2nonevsMiniMax M2.5medium DeepSeek V3.2nonevsgpt-oss-120bmediumمتاح مجانًا Gemini 2.5 FlashmediumvsGLM 5none DeepSeek V3.2nonevsGPT-5 Minimedium DeepSeek V3.2nonevsQwen3.5-Flashmedium DeepSeek V3.2nonevsGPT-5 Nanomedium DeepSeek V3.2nonevsQwen3 Coder Nextmedium