التنقل
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs DeepSeek: DeepSeek V4 Pro

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-24

المقياس Claude Opus 4.6 Claude Opus 4.6 medium الإصدار: 2026-02-05 DeepSeek V4 Pro DeepSeek V4 Pro high الإصدار: 2026-04-24
النتيجة 7.6 7.4
الترتيب #43 #50
الاتساق 9.1 10.0
اختبارات صحيحة
معدل النجاح لكل محاولة 70.4% 61.1%
اختبارات غير مستقرة 2 0
إجمالي مرات التشغيل 54 24
التكلفة لكل نتيجة 12.047 1.385
إجمالي التكلفة $1.446 $0.153
??? ??????? $5.000 / 1M $1.740 / 1M
??? ??????? $25.000 / 1M $3.480 / 1M
رموز الإخراج 29,829 584
رموز الاستدلال 18,938 37,708
زمن الاستجابة (المتوسط) 21.08s 78.45s
زمن الاستجابة (الحد الأقصى) 83.40s 351.99s
زمن الاستجابة (الإجمالي) 231.84s 1255.22s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
DeepSeek V4 Pro 8.3 10.0 75.0% 0 32.12s 64 1,799
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
DeepSeek V4 Pro 10.0 10.0 100.0% 0 93.00s 82 2,808
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
DeepSeek V4 Pro 10.0 10.0 100.0% 0 71.08s 134 2,163
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
DeepSeek V4 Pro 10.0 10.0 100.0% 0 63.00s 67 1,071
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
DeepSeek V4 Pro 5.3 10.0 33.3% 0 202.56s 11 25,343
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
DeepSeek V4 Pro 5.0 10.0 0.0% 0 26.96s 51 734
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
DeepSeek V4 Pro 3.0 10.0 0.0% 0 0ms 0 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
DeepSeek V4 Pro 7.7 10.0 66.7% 0 63.66s 91 3,617
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
DeepSeek V4 Pro 10.0 10.0 100.0% 0 11.05s 84 173

مقارنة سريعة

تبديل زوج المقارنة