AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs DeepSeek: DeepSeek V4 Pro

الملخص

مقارنة benchmark بين Seed-2.0-Lite و DeepSeek V4 Pro: يتقدم Seed-2.0-Lite في متوسط النتيجة بـ 8.5 مقابل 7.6. لدى DeepSeek V4 Pro تكلفة benchmark أقل عند $0.157 مقابل $0.175. Seed-2.0-Lite أسرع عند 47.07s مقابل 77.20s، مع معدلات نجاح 76.2% مقابل 66.7%.

النموذج الموصى به: Seed-2.0-Lite - It has the best score here (8.5), while responding about 1.6x faster than DeepSeek V4 Pro.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس	Seed-2.0-Lite Seed-2.0-Lite medium الإصدار: 2026-02-14	DeepSeek V4 Pro DeepSeek V4 Pro high الإصدار: 2026-04-24

المقياس	Seed-2.0-Lite Seed-2.0-Lite medium الإصدار: 2026-02-14	DeepSeek V4 Pro DeepSeek V4 Pro high الإصدار: 2026-04-24
النتيجة	8.5	7.6
الترتيب	#18	#41
الموثوقية	10.0	9.3
الاتساق	9.0	7.0
اختبارات صحيحة
معدل النجاح لكل محاولة	76.2%	66.7%
اختبارات غير مستقرة	3	8
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	1.250	1.742
إجمالي التكلفة	$0.175	$0.157
سعر الإدخال	$0.250 / 1M	$0.435 / 1M
سعر الإخراج	$2.000 / 1M	$0.870 / 1M
إجمالي رموز الإدخال	46,740	38,726
رموز الإخراج	3,230	6,334
رموز الاستدلال	78,406	159,151
زمن الاستجابة (المتوسط)	47.07s	77.20s
زمن الاستجابة (الحد الأقصى)	254.92s	416.76s
زمن الاستجابة (الإجمالي)	988.37s	1621.17s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#18 Seed-2.0-Lite

medium

التكلفة: $0.005
الوقت: 86.7s
الرموز: 2,354 tok

#41 DeepSeek V4 Pro

high

التكلفة: $0.023
الوقت: 257.6s
الرموز: 14,870 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	942	996	7,142
DeepSeek V4 Pro	5.7	5.9	58.3%	2		25.70s	536	149	3,214

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	8.0	9.8	66.7%	0		156.74s	8,247	458	31,890
DeepSeek V4 Pro	6.1	4.6	66.7%	2		243.00s	5,090	383	84,580

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	16,254	506	4,299
DeepSeek V4 Pro	10.0	10.0	100.0%	0		38.17s	14,060	454	5,836

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	8,562	246	1,742
DeepSeek V4 Pro	10.0	10.0	100.0%	0		25.03s	7,690	274	2,166

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	843	15	23,897
DeepSeek V4 Pro	3.6	7.2	22.2%	1		151.46s	569	4,404	50,391

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	582	304	1,620
DeepSeek V4 Pro	10.0	10.0	100.0%	0		8.83s	471	115	1,013

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	834	71	1,480
DeepSeek V4 Pro	7.8	6.6	83.3%	1		8.73s	627	66	2,726

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	9.0	7.9	88.9%	1		10.23s	894	403	3,285
DeepSeek V4 Pro	6.9	4.9	77.8%	2		56.85s	591	178	2,563

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	9,306	222	1,011
DeepSeek V4 Pro	9.8	10.0	100.0%	0		15.92s	8,909	295	701

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	276	9	2,040
DeepSeek V4 Pro	3.0	10.0	0.0%	0		34.01s	183	16	5,961

مقارنة سريعة

تبديل زوج المقارنة

Seed-2.0-LitemediumvsGPT-5.2 Chatnone DeepSeek V4 ProhighvsMiniMax M3medium DeepSeek V4 ProhighvsGrok Build 0.1medium DeepSeek V4 ProhighvsKimi K2.5medium DeepSeek V4 ProhighvsMercury 2medium DeepSeek V4 ProhighvsStep 3.7 Flashlow Claude Opus 4.6mediumvsDeepSeek V4 Prohigh DeepSeek V4 ProhighvsGPT-5.3 Chatnone DeepSeek V4 ProhighvsGPT-5.4 Nanomedium DeepSeek V4 ProhighvsGrok 4.3medium DeepSeek V4 ProhighvsQwen3.5-122B-A10Bmedium DeepSeek V4 ProhighvsQwen3.6 Flashmedium