DeepSeek V4 Pro (high) vs GPT-5.4 Mini (medium)

يتقدم DeepSeek V4 Pro (high) في متوسط النتيجة بـ 7.7 مقابل 7.5. لدى DeepSeek V4 Pro (high) تكلفة benchmark أقل عند $0.200 مقابل $0.756. GPT-5.4 Mini (medium) أسرع عند 25.94s مقابل 79.14s، مع معدلات نجاح 63.6% مقابل 71.2%.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-08-01

الترتيب: #58
إجمالي رموز الإخراج: 189,181
زمن الاستجابة (المتوسط): 79.14s
إجمالي التكلفة: $0.200

الترتيب: #69
إجمالي رموز الإخراج: 151,755
زمن الاستجابة (المتوسط): 25.94s
إجمالي التكلفة: $0.756

النموذج الموصى به DeepSeek V4 Pro (high)

It has the best score here (7.7), while costing about 3.8x less than GPT-5.4 Mini (medium).

مقارنة تفصيلية

المقياس	DeepSeek V4 Pro DeepSeek V4 Pro high الإصدار: 2026-04-24	GPT-5.4 Mini GPT-5.4 Mini medium الإصدار: 2026-03-17

المقياس	DeepSeek V4 Pro DeepSeek V4 Pro high الإصدار: 2026-04-24	GPT-5.4 Mini GPT-5.4 Mini medium الإصدار: 2026-03-17
النتيجة	7.7	7.5
الترتيب	#58	#69
الموثوقية	10.0	10.0
الاتساق	7.7	7.7
اختبارات صحيحة
معدل النجاح لكل محاولة	63.6%	71.2%
اختبارات غير مستقرة	6	6
إجمالي مرات التشغيل	66	66
التكلفة لكل نتيجة	2.000	6.299
إجمالي التكلفة	$0.200	$0.756
سعر الإدخال	$0.435 / 1M	$0.750 / 1M
سعر الإخراج	$0.870 / 1M	$4.500 / 1M
إجمالي رموز الإدخال	90,748	97,155
رموز الإخراج	10,462	6,211
رموز الاستدلال	178,719	145,544
زمن الاستجابة (المتوسط)	79.14s	25.94s
زمن الاستجابة (الحد الأقصى)	416.76s	138.75s
زمن الاستجابة (الإجمالي)	1740.97s	570.66s

عرض إنشاء النماذج

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#58 DeepSeek V4 Pro

high

التكلفة: $0.023
الوقت: 257.6s
الرموز: 14,870 tok

#69 GPT-5.4 Mini

medium

التكلفة: $0.056
الوقت: 95.5s
الرموز: 12,464 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

الفئة:

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	5.7	5.9	58.3%	2		25.70s	536	149	3,214
GPT-5.4 Mini	8.6	7.9	91.7%	1		4.05s	606	296	2,876

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	6.3	8.7	33.3%	0		243.00s	5,090	383	84,580
GPT-5.4 Mini	8.4	7.4	88.9%	1		57.87s	7,305	467	40,902

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	10.0	10.0	100.0%	0		78.99s	66,082	4,582	25,404
GPT-5.4 Mini	6.9	5.9	66.7%	1		59.64s	74,058	4,347	40,924

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	10.0	10.0	100.0%	0		25.03s	7,690	274	2,166
GPT-5.4 Mini	10.0	10.0	100.0%	0		2.43s	7,140	234	650

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	3.6	7.2	22.2%	1		151.46s	569	4,404	50,391
GPT-5.4 Mini	4.1	4.4	44.5%	2		65.31s	619	60	43,286

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	10.0	10.0	100.0%	0		8.83s	471	115	1,013
GPT-5.4 Mini	4.5	10.0	0.0%	0		3.72s	477	150	510

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	7.8	6.6	83.3%	1		8.73s	627	66	2,726
GPT-5.4 Mini	9.8	10.0	100.0%	0		2.13s	660	96	1,185

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	6.9	4.9	77.8%	2		56.85s	591	178	2,563
GPT-5.4 Mini	7.8	10.0	66.7%	0		4.37s	642	278	2,443

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	9.8	10.0	100.0%	0		15.92s	8,909	295	701
GPT-5.4 Mini	4.7	1.6	66.7%	1		9.62s	5,453	251	2,594

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	3.0	10.0	0.0%	0		34.01s	183	16	5,961
GPT-5.4 Mini	3.0	10.0	0.0%	0		30.10s	195	32	10,174

مقارنة سريعة

تبديل زوج المقارنة

Claude Opus 4.6mediumvsDeepSeek V4 Prohigh DeepSeek V4 ProhighvsMiniMax M3medium GPT-5.4 MinimediumvsQwen3.7 Maxnone Claude Opus 5nonevsGPT-5.4 Minimedium DeepSeek V4 ProhighvsGLM 5medium DeepSeek V4 ProhighvsGrok Build 0.1medium DeepSeek V4 ProhighvsGPT-5.6 Lunamedium Claude Opus 4.8lowvsDeepSeek V4 Prohigh DeepSeek V4 ProhighvsNemotron 3 Ultramediumمتاح مجانًا Gemini 3 Flash PreviewlowvsGPT-5.4 Minimedium Claude Opus 5nonevsDeepSeek V4 Prohigh KAT-Coder-Pro V2.5lowvsGPT-5.4 Minimedium