Claude Opus 4.6 (medium) vs DeepSeek V4 Pro (high)

النموذج الموصى به DeepSeek V4 Pro (high)

It has the best score here (7.7), while costing about 15.3x less than Claude Opus 4.6 (medium).

مقارنة تفصيلية

المقياس	Claude Opus 4.6 Claude Opus 4.6 medium الإصدار: 2026-02-05	DeepSeek V4 Pro DeepSeek V4 Pro high الإصدار: 2026-04-24

المقياس	Claude Opus 4.6 Claude Opus 4.6 medium الإصدار: 2026-02-05	DeepSeek V4 Pro DeepSeek V4 Pro high الإصدار: 2026-04-24
النتيجة	7.7	7.7
الترتيب	#55	#58
الموثوقية	10.0	10.0
الاتساق	8.8	7.7
اختبارات صحيحة
معدل النجاح لكل محاولة	63.6%	63.6%
اختبارات غير مستقرة	3	6
إجمالي مرات التشغيل	66	66
التكلفة لكل نتيجة	23.524	2.000
إجمالي التكلفة	$3.059	$0.200
سعر الإدخال	$5.000 / 1M	$0.435 / 1M
سعر الإخراج	$25.000 / 1M	$0.870 / 1M
إجمالي رموز الإدخال	108,615	90,748
رموز الإخراج	72,286	10,462
رموز الاستدلال	28,315	178,719
زمن الاستجابة (المتوسط)	34.27s	79.14s
زمن الاستجابة (الحد الأقصى)	151.51s	416.76s
زمن الاستجابة (الإجمالي)	513.99s	1740.97s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

SVG غير صالح

high

الفئة:

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.6	6.4	5.8	66.7%	2		7.45s	840	986	1,071
DeepSeek V4 Pro	5.7	5.9	58.3%	2		25.70s	536	149	3,214

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.6	5.7	7.1	44.4%	1		30.10s	8,522	13,057	4,121
DeepSeek V4 Pro	6.3	8.7	33.3%	0		243.00s	5,090	383	84,580

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.6	10.0	10.0	100.0%	0		114.08s	76,073	33,018	9,509
DeepSeek V4 Pro	10.0	10.0	100.0%	0		78.99s	66,082	4,582	25,404

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.6	10.0	10.0	100.0%	0		7.37s	8,676	691	757
DeepSeek V4 Pro	10.0	10.0	100.0%	0		25.03s	7,690	274	2,166

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.6	3.0	10.0	0.0%	0		83.40s	674	14,642	8,687
DeepSeek V4 Pro	3.6	7.2	22.2%	1		151.46s	569	4,404	50,391

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.6	10.0	10.0	100.0%	0		5.04s	564	188	292
DeepSeek V4 Pro	10.0	10.0	100.0%	0		8.83s	471	115	1,013

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.6	10.0	10.0	100.0%	0		2.43s	792	266	467
DeepSeek V4 Pro	7.8	6.6	83.3%	1		8.73s	627	66	2,726

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.6	7.7	10.0	66.7%	0		4.71s	816	532	630
DeepSeek V4 Pro	6.9	4.9	77.8%	2		56.85s	591	178	2,563

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.6	10.0	10.0	100.0%	0		9.73s	11,454	861	329
DeepSeek V4 Pro	9.8	10.0	100.0%	0		15.92s	8,909	295	701

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.6	3.0	10.0	0.0%	0		63.24s	204	8,045	2,452
DeepSeek V4 Pro	3.0	10.0	0.0%	0		34.01s	183	16	5,961

تبديل زوج المقارنة