AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen3.6 Plus Preview

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-22

المقياس	Seed-2.0-Lite Seed-2.0-Lite medium الإصدار: 2026-02-14	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium الإصدار: 2026-04-20 متاح مجانًا

المقياس	Seed-2.0-Lite Seed-2.0-Lite medium الإصدار: 2026-02-14	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium الإصدار: 2026-04-20 متاح مجانًا
النتيجة	8.1	8.2
الترتيب	#21	#16
الموثوقية	10.0	غير متاح
الاتساق	8.9	10.0
اختبارات صحيحة
معدل النجاح لكل محاولة	75.0%	75.0%
اختبارات غير مستقرة	3	0
إجمالي مرات التشغيل	60	57
التكلفة لكل نتيجة	1.170	0.000
إجمالي التكلفة	$0.153	$0.000
??? ???????	$0.250 / 1M	$0.000 / 1M
??? ???????	$2.000 / 1M	$0.000 / 1M
رموز الإخراج	3,282	1,153
رموز الاستدلال	67,287	62,197
زمن الاستجابة (المتوسط)	36.79s	15.25s
زمن الاستجابة (الحد الأقصى)	168.71s	43.55s
زمن الاستجابة (الإجمالي)	735.86s	182.96s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	996	7,142
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		11.69s	61	5,812

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	7.0	9.7	50.0%	0		107.65s	452	20,524
Qwen3.6 Plus Preview	0.0	0.0	0.0%	0		0ms	0	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	506	4,299
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		34.95s	452	13,073

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	246	1,742
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		14.95s	270	10,706

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	15	23,897
Qwen3.6 Plus Preview	3.0	10.0	0.0%	0		22.08s	49	26,895

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	304	1,620
Qwen3.6 Plus Preview	0.0	0.0	0.0%	0		0ms	0	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	71	1,480
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		3.40s	27	1,383

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	9.0	7.9	88.9%	1		11.03s	461	3,532
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		7.52s	27	2,998

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	222	1,011
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		5.87s	267	1,330

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	9	2,040
Qwen3.6 Plus Preview	0.0	0.0	0.0%	0		0ms	0	0

مقارنة سريعة

تبديل زوج المقارنة

Seed-2.0-LitemediumvsGemini 3.5 Flashminimal Seed-2.0-LitemediumvsQwen3.7 Maxnone Seed-2.0-LitemediumvsGemini 3 Flash Previewnone Seed-2.0-LitemediumvsGemini 3.1 Flash Lite Previewlow Seed-2.0-LitemediumvsGPT-5.2 Chatnone Seed-2.0-LitemediumvsGemini 3 Flash Previewlow Seed-2.0-LitemediumvsGemini 3.1 Flash Lite Previewnone Seed-2.0-LitemediumvsGemini 3.1 Flash Litelow Seed-2.0-LitemediumvsGPT-5.3 Chatnone Seed-2.0-LitemediumvsDeepSeek V4 Flashhighمتاح مجانًا Seed-2.0-LitemediumvsRing-2.6-1Tnone Seed-2.0-LitemediumvsGemini 3.5 Flashnone