التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Qwen: Qwen3.5-9B

الملخص

مقارنة benchmark بين DeepSeek V3.2 و Qwen3.5-9B: يتقدم DeepSeek V3.2 في متوسط النتيجة بـ 5.3 مقابل 3.8. لدى DeepSeek V3.2 تكلفة benchmark أقل عند $0.017 مقابل $0.036. DeepSeek V3.2 أسرع عند 13.83s مقابل 82.24s، مع معدلات نجاح 39.7% مقابل 27.0%.

النموذج الموصى به: DeepSeek V3.2 - It has the best score here (5.3), while costing about 2.1x less than Qwen3.5-9B.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس DeepSeek V3.2 DeepSeek V3.2 none الإصدار: 2025-12-01 Qwen3.5-9B Qwen3.5-9B medium الإصدار: 2026-03-02
النتيجة 5.3 3.8
الترتيب #126 #165
الموثوقية 10.0 6.7
الاتساق 7.6 8.0
اختبارات صحيحة
معدل النجاح لكل محاولة 39.7% 27.0%
اختبارات غير مستقرة 6 5
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 0.306 1.187
إجمالي التكلفة $0.017 $0.036
سعر الإدخال $0.229 / 1M $0.100 / 1M
سعر الإخراج $0.344 / 1M $0.150 / 1M
إجمالي رموز الإدخال 55,997 17,070
رموز الإخراج 11,165 29,045
رموز الاستدلال 0 209,516
زمن الاستجابة (المتوسط) 13.83s 82.24s
زمن الاستجابة (الحد الأقصى) 115.89s 226.38s
زمن الاستجابة (الإجمالي) 290.43s 1315.88s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#126 DeepSeek V3.2

none
التكلفة
$0.002
الوقت
7.0s
الرموز
1,046 tok

#165 Qwen3.5-9B

medium
التكلفة
$0.001
الوقت
35.9s
الرموز
3,030 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V3.2 3.2 8.0 8.3% 1 9.35s 494 1,073 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 369 2,621 12,411
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V3.2 3.1 6.9 11.1% 1 14.54s 7,279 4,528 0
Qwen3.5-9B 2.9 10.0 0.0% 0 100.88s 2,396 7,890 41,129
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 29,843 2,887 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 7,890 1,710 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 4,722 1,383 32,113
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V3.2 2.9 7.2 11.1% 1 4.17s 624 21 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 295 11,549 48,475
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V3.2 4.7 1.6 66.7% 1 9.32s 314 43 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 180 0 30,695
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 627 66 0
Qwen3.5-9B 6.5 10.0 50.0% 0 5.75s 381 491 1,824
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V3.2 7.6 7.2 77.8% 1 6.91s 424 298 0
Qwen3.5-9B 3.0 10.0 0.0% 0 32.27s 376 1,593 12,026
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 8,319 522 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 8,283 444 1,149
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V3.2 3.0 10.0 0.0% 0 17.23s 183 17 0
Qwen3.5-9B 3.0 10.0 0.0% 0 177.02s 68 3,074 29,694

مقارنة سريعة

تبديل زوج المقارنة