AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs DeepSeek: DeepSeek V4 Pro

الملخص

مقارنة benchmark بين Seed-2.0-Lite و DeepSeek V4 Pro: يتقدم DeepSeek V4 Pro في متوسط النتيجة بـ 6.0 مقابل 5.8. لدى Seed-2.0-Lite تكلفة benchmark أقل عند $0.019 مقابل $0.079. Seed-2.0-Lite أسرع عند 2.49s مقابل 65.21s، مع معدلات نجاح 46.0% مقابل 52.4%.

النموذج الموصى به: Seed-2.0-Lite - Its score stays close to the best score here (5.8 vs 6.0), while costing about 4.3x less than DeepSeek V4 Pro.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-10

المقياس	Seed-2.0-Lite Seed-2.0-Lite none الإصدار: 2026-02-14	DeepSeek V4 Pro DeepSeek V4 Pro high الإصدار: 2026-04-24

المقياس	Seed-2.0-Lite Seed-2.0-Lite none الإصدار: 2026-02-14	DeepSeek V4 Pro DeepSeek V4 Pro high الإصدار: 2026-04-24
النتيجة	5.8	6.0
الترتيب	#111	#104
الموثوقية	10.0	9.0
الاتساق	8.4	7.6
اختبارات صحيحة
معدل النجاح لكل محاولة	46.0%	52.4%
اختبارات غير مستقرة	4	6
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	0.228	2.869
إجمالي التكلفة	$0.019	$0.079
سعر الإدخال	$0.250 / 1M	$0.435 / 1M
سعر الإخراج	$2.000 / 1M	$0.870 / 1M
إجمالي رموز الإدخال	46,573	32,240
رموز الإخراج	3,259	12,250
رموز الاستدلال	0	72,257
زمن الاستجابة (المتوسط)	2.49s	65.21s
زمن الاستجابة (الحد الأقصى)	6.70s	358.35s
زمن الاستجابة (الإجمالي)	52.26s	1304.19s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#111 Seed-2.0-Lite

none

Cost: $0.005
Time: 83.8s
Tokens: 2,311 tok

#104 DeepSeek V4 Pro

high

Cost: $0.023
Time: 257.6s
Tokens: 14,870 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	894	709	0
DeepSeek V4 Pro	6.4	7.9	58.3%	1		16.53s	448	71	3,617

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	5.6	10.0	33.3%	0		2.83s	8,215	410	0
DeepSeek V4 Pro	3.3	6.4	11.1%	1		118.23s	1,966	111	20,940

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	16,215	498	0
DeepSeek V4 Pro	10.0	10.0	100.0%	0		65.02s	14,016	465	5,914

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	8,538	246	0
DeepSeek V4 Pro	7.3	5.9	83.3%	1		23.62s	5,633	229	1,710

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	939	17	0
DeepSeek V4 Pro	2.9	7.2	11.1%	1		205.66s	430	10,529	28,089

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	570	294	0
DeepSeek V4 Pro	6.1	3.1	66.7%	1		25.09s	314	76	1,152

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	810	73	0
DeepSeek V4 Pro	10.0	10.0	100.0%	0		41.16s	627	205	2,416

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	5.3	7.2	44.4%	1		2.78s	858	709	0
DeepSeek V4 Pro	5.9	7.2	55.6%	1		34.84s	544	139	4,019

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	9,270	292	0
DeepSeek V4 Pro	10.0	10.0	100.0%	0		21.33s	8,079	372	593

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	264	11	0
DeepSeek V4 Pro	3.0	10.0	0.0%	0		39.14s	183	53	3,807

مقارنة سريعة

تبديل زوج المقارنة