قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs OpenAI: GPT-5 Mini

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس	DeepSeek: DeepSeek V3.2 none الإصدار: 2025-12-01	OpenAI: GPT-5 Mini medium الإصدار: 2025-08-07
الترتيب	#39	#33
متوسط الدرجة	4.70	5.77
الاتساق	8.19	8.79
التكلفة لكل نتيجة	0.132	1.200
إجمالي التكلفة	$0.007	$0.084
اختبارات صحيحة
معدل النجاح لكل محاولة	47.6%	57.1%
اختبارات غير مستقرة	3	2
رموز الإخراج	4,869	4,723
رموز الاستدلال	0	35,392

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	1.00	9.68	0.0%	0		1,411	0
OpenAI: GPT-5 Mini	7.00	9.62	66.7%	0		1,645	5,824

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	5.38	5.81	66.7%	1		1,710	0
OpenAI: GPT-5 Mini	9.88	10.00	100.0%	0		453	3,200

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	1.00	7.21	22.2%	1		24	0
OpenAI: GPT-5 Mini	1.00	7.21	22.2%	1		293	14,016

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	8.00	9.99	50.0%	0		66	0
OpenAI: GPT-5 Mini	7.00	6.64	66.7%	1		318	4,992

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	7.67	7.49	88.9%	1		1,136	0
OpenAI: GPT-5 Mini	4.33	9.78	33.3%	0		1,527	5,760

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
DeepSeek: DeepSeek V3.2	10.00	10.00	100.0%	0		522	0
OpenAI: GPT-5 Mini	10.00	10.00	100.0%	0		487	1,600

مقارنة سريعة

تبديل زوج المقارنة

GPT-5 MinimediumvsGLM 5none Gemini 2.5 FlashnonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none DeepSeek V3.2nonevsGLM 4.7 Flashmedium GPT-5 MinimediumvsQwen3.5-122B-A10Bnone Claude Sonnet 4.6nonevsGPT-5 Minimedium DeepSeek V3.2nonevsMiniMax M2.5medium DeepSeek V3.2nonevsgpt-oss-120bmediumمتاح مجانًا GPT-5 MinimediumvsQwen3.5-27Bnone DeepSeek V3.2nonevsQwen3.5-Flashmedium GPT-5 MinimediumvsQwen3.5-35B-A3Bnone DeepSeek V3.2nonevsGPT-5 Nanomedium