AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs DeepSeek: DeepSeek V4 Pro

الملخص

مقارنة benchmark بين Seed-2.0-Mini و DeepSeek V4 Pro: يتقدم DeepSeek V4 Pro في متوسط النتيجة بـ 7.6 مقابل 7.4. لدى Seed-2.0-Mini تكلفة benchmark أقل عند $0.044 مقابل $0.157. DeepSeek V4 Pro أسرع عند 77.20s مقابل 80.22s، مع معدلات نجاح 57.1% مقابل 66.7%.

النموذج الموصى به: Seed-2.0-Mini - Its score stays close to the best score here (7.4 vs 7.6), while costing about 3.6x less than DeepSeek V4 Pro.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-17

المقياس	Seed-2.0-Mini Seed-2.0-Mini medium الإصدار: 2026-02-14	DeepSeek V4 Pro DeepSeek V4 Pro high الإصدار: 2026-04-24

المقياس	Seed-2.0-Mini Seed-2.0-Mini medium الإصدار: 2026-02-14	DeepSeek V4 Pro DeepSeek V4 Pro high الإصدار: 2026-04-24
النتيجة	7.4	7.6
الترتيب	#50	#41
الموثوقية	6.7	9.3
الاتساق	9.3	7.0
اختبارات صحيحة
معدل النجاح لكل محاولة	57.1%	66.7%
اختبارات غير مستقرة	2	8
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	0.397	1.742
إجمالي التكلفة	$0.044	$0.157
سعر الإدخال	$0.100 / 1M	$0.435 / 1M
سعر الإخراج	$0.400 / 1M	$0.870 / 1M
إجمالي رموز الإدخال	41,904	38,726
رموز الإخراج	2,555	6,334
رموز الاستدلال	95,974	159,151
زمن الاستجابة (المتوسط)	80.22s	77.20s
زمن الاستجابة (الحد الأقصى)	262.83s	416.76s
زمن الاستجابة (الإجمالي)	1363.72s	1621.17s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#50 Seed-2.0-Mini

medium

Cost: $0.002
Time: 161.7s
Tokens: 4,379 tok

#41 DeepSeek V4 Pro

high

Cost: $0.023
Time: 257.6s
Tokens: 14,870 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Mini	6.6	10.0	50.0%	0		74.75s	791	360	9,520
DeepSeek V4 Pro	5.7	5.9	58.3%	2		25.70s	536	149	3,214

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Mini	5.5	9.8	33.3%	0		220.48s	3,823	464	34,964
DeepSeek V4 Pro	6.1	4.6	66.7%	2		243.00s	5,090	383	84,580

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Mini	10.0	10.0	100.0%	0		262.83s	16,533	404	29,806
DeepSeek V4 Pro	10.0	10.0	100.0%	0		38.17s	14,060	454	5,836

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Mini	10.0	10.0	100.0%	0		24.27s	8,568	246	2,743
DeepSeek V4 Pro	10.0	10.0	100.0%	0		25.03s	7,690	274	2,166

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Mini	3.0	10.0	0.0%	0		0ms	0	0	0
DeepSeek V4 Pro	3.6	7.2	22.2%	1		151.46s	569	4,404	50,391

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Mini	5.1	3.4	33.3%	1		36.65s	585	213	4,210
DeepSeek V4 Pro	10.0	10.0	100.0%	0		8.83s	471	115	1,013

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Mini	10.0	10.0	100.0%	0		17.47s	840	69	2,050
DeepSeek V4 Pro	7.8	6.6	83.3%	1		8.73s	627	66	2,726

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Mini	8.2	7.2	88.9%	1		31.79s	903	527	5,667
DeepSeek V4 Pro	6.9	4.9	77.8%	2		56.85s	591	178	2,563

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Mini	10.0	10.0	100.0%	0		88.68s	9,585	222	5,235
DeepSeek V4 Pro	9.8	10.0	100.0%	0		15.92s	8,909	295	701

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Seed-2.0-Mini	3.0	10.0	0.0%	0		56.76s	276	50	1,779
DeepSeek V4 Pro	3.0	10.0	0.0%	0		34.01s	183	16	5,961

مقارنة سريعة

تبديل زوج المقارنة

DeepSeek V4 ProhighvsMiniMax M3medium DeepSeek V4 ProhighvsGrok Build 0.1medium Seed-2.0-MinimediumvsGemini 3 Flash Previewlow DeepSeek V4 ProhighvsKimi K2.5medium DeepSeek V4 ProhighvsMercury 2medium DeepSeek V4 ProhighvsStep 3.7 Flashlow Claude Opus 4.6mediumvsDeepSeek V4 Prohigh DeepSeek V4 ProhighvsGPT-5.3 Chatnone Seed-2.0-MinimediumvsGPT-5.3 Chatnone DeepSeek V4 ProhighvsGPT-5.4 Nanomedium Claude Sonnet 4.6nonevsSeed-2.0-Minimedium DeepSeek V4 ProhighvsGrok 4.3medium