التنقل
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs DeepSeek: DeepSeek V3.2

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-30

المقياس Claude Sonnet 4.6 Claude Sonnet 4.6 medium الإصدار: 2026-02-17 DeepSeek V3.2 DeepSeek V3.2 medium الإصدار: 2025-12-01
النتيجة 8.0 8.0
الترتيب #36 #37
الموثوقية غير متاح غير متاح
الاتساق 9.5 8.2
اختبارات صحيحة
معدل النجاح لكل محاولة 74.1% 79.6%
اختبارات غير مستقرة 1 4
إجمالي مرات التشغيل 54 52
التكلفة لكل نتيجة 8.930 0.231
إجمالي التكلفة $1.161 $0.028
??? ??????? $3.000 / 1M $0.252 / 1M
??? ??????? $15.000 / 1M $0.378 / 1M
رموز الإخراج 42,068 7,554
رموز الاستدلال 26,784 45,588
زمن الاستجابة (المتوسط) 12.66s 43.49s
زمن الاستجابة (الحد الأقصى) 46.35s 180.92s
زمن الاستجابة (الإجمالي) 126.62s 782.73s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 6.5 10.0 50.0% 0 2.98s 1,046 1,093
DeepSeek V3.2 8.4 9.9 75.0% 0 30.72s 3,773 7,523
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 10.0 10.0 100.0% 0 35.76s 6,894 2,097
DeepSeek V3.2 4.7 1.6 66.7% 1 180.92s 626 6,792
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 10.0 10.0 100.0% 0 46.35s 5,871 3,962
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 10.0 10.0 100.0% 0 13.90s 649 742
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 2.9 7.2 11.1% 1 0ms 25,790 16,919
DeepSeek V3.2 5.3 7.2 44.4% 1 21.78s 15 4,933
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.94s 256 433
DeepSeek V3.2 5.4 2.5 66.7% 1 31.30s 68 2,366
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 10.0 10.0 100.0% 0 2.61s 318 552
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.80s 589 635
DeepSeek V3.2 8.2 7.2 88.9% 1 36.87s 390 6,281
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 10.0 10.0 100.0% 0 7.48s 655 351
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859

مقارنة سريعة

تبديل زوج المقارنة