AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs DeepSeek: DeepSeek V4 Flash

الملخص

مقارنة benchmark بين Claude Opus 4.7 (medium) و DeepSeek V4 Flash (high): يتقدم Claude Opus 4.7 (medium) في متوسط النتيجة بـ 8.7 مقابل 8.3. لدى DeepSeek V4 Flash (high) تكلفة benchmark أقل عند $0.027 مقابل $0.679. Claude Opus 4.7 (medium) أسرع عند 4.73s مقابل 45.85s، مع معدلات نجاح 82.5% مقابل 74.6%.

النموذج الموصى به: DeepSeek V4 Flash (high) - Its score stays close to the best score here (8.3 vs 8.7), while costing about 26.0x less than Claude Opus 4.7 (medium).

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-09

المقياس	Claude Opus 4.7 Claude Opus 4.7 medium الإصدار: 2026-04-16	DeepSeek V4 Flash DeepSeek V4 Flash high الإصدار: 2026-04-24

المقياس	Claude Opus 4.7 Claude Opus 4.7 medium الإصدار: 2026-04-16	DeepSeek V4 Flash DeepSeek V4 Flash high الإصدار: 2026-04-24
النتيجة	8.7	8.3
الترتيب	#16	#27
الموثوقية	10.0	10.0
الاتساق	9.6	8.5
اختبارات صحيحة
معدل النجاح لكل محاولة	82.5%	74.6%
اختبارات غير مستقرة	1	4
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	3.991	0.299
إجمالي التكلفة	$0.679	$0.027
سعر الإدخال	$5.000 / 1M	$0.090 / 1M
سعر الإخراج	$25.000 / 1M	$0.180 / 1M
إجمالي رموز الإدخال	65,406	39,745
رموز الإخراج	11,858	10,310
رموز الاستدلال	2,198	123,501
زمن الاستجابة (المتوسط)	4.73s	45.85s
زمن الاستجابة (الحد الأقصى)	23.18s	218.13s
زمن الاستجابة (الإجمالي)	94.51s	962.79s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#16 Claude Opus 4.7

medium

التكلفة: $0.059
الوقت: 26.8s
الرموز: 2,475 tok

#27 DeepSeek V4 Flash

high

التكلفة: $0.003
الوقت: 93.1s
الرموز: 7,926 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	540	140	7,770

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
DeepSeek V4 Flash	7.8	10.0	66.7%	0		50.60s	7,279	395	34,862

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	10.0	10.0	100.0%	0		21.45s	24,501	2,369	1,084
DeepSeek V4 Flash	10.0	10.0	100.0%	0		76.57s	14,016	465	7,347

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	7,290	201	1,179

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	666	27	59,249

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	471	79	632

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	627	63	1,622

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
DeepSeek V4 Flash	8.2	7.2	88.9%	1		26.11s	594	196	1,767

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	8,079	228	542

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
DeepSeek V4 Flash	3.0	10.0	0.0%	0		54.46s	183	8,516	8,531

مقارنة سريعة

تبديل زوج المقارنة