AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: gpt-oss-120b

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-26

المقياس	Seed-2.0-Lite Seed-2.0-Lite none الإصدار: 2026-02-14	gpt-oss-120b gpt-oss-120b none الإصدار: 2025-08-05 متاح مجانًا

المقياس	Seed-2.0-Lite Seed-2.0-Lite none الإصدار: 2026-02-14	gpt-oss-120b gpt-oss-120b none الإصدار: 2025-08-05 متاح مجانًا
النتيجة	5.9	5.4
الترتيب	#100	#119
الموثوقية	10.0	10.0
الاتساق	8.3	9.1
اختبارات صحيحة
معدل النجاح لكل محاولة	48.3%	38.6%
اختبارات غير مستقرة	4	2
إجمالي مرات التشغيل	98	133
التكلفة لكل نتيجة	0.405	0.302
إجمالي التكلفة	$0.033	$0.019
??? ???????	$0.250 / 1M	$0.000 / 1M
??? ???????	$2.000 / 1M	$0.000 / 1M
رموز الإخراج	10,283	91,564
رموز الاستدلال	0	0
زمن الاستجابة (المتوسط)	2.48s	21.61s
زمن الاستجابة (الحد الأقصى)	6.70s	113.71s
زمن الاستجابة (الإجمالي)	49.67s	345.79s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
gpt-oss-120b	6.5	10.0	50.0%	0		32.84s	8,676	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	6.8	9.9	50.0%	0		2.95s	404	0
gpt-oss-120b	4.3	1.1	66.7%	1		9.57s	3,232	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
gpt-oss-120b	6.5	10.0	50.0%	0		7.12s	598	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
gpt-oss-120b	3.0	10.0	0.0%	0		34.98s	29,483	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
gpt-oss-120b	4.8	10.0	0.0%	0		10.79s	615	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
gpt-oss-120b	9.8	10.0	100.0%	0		5.06s	10,870	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	5.3	7.2	44.4%	1		2.78s	7,739	0
gpt-oss-120b	6.0	7.2	55.6%	1		8.21s	34,952	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	11	0
gpt-oss-120b	3.0	10.0	0.0%	0		47.29s	3,138	0

مقارنة سريعة

تبديل زوج المقارنة

MiniMax M2.5mediumمتاح مجانًاvsgpt-oss-120bnoneمتاح مجانًا Mistral Small 4mediumvsgpt-oss-120bnoneمتاح مجانًا Seed-2.0-LitenonevsOwl Alphamedium Seed-2.0-Litenonevsgpt-oss-120bmediumمتاح مجانًا Seed-2.0-LitenonevsNemotron 3 Supermediumمتاح مجانًا gpt-oss-120bnoneمتاح مجانًاvsElephant Alphamedium MiniMax M2.7mediumvsgpt-oss-120bnoneمتاح مجانًا Cobuddymediumمتاح مجانًاvsSeed-2.0-Litenone Seed-2.0-LitenonevsGPT-5 Nanomedium Cobuddymediumمتاح مجانًاvsgpt-oss-120bnoneمتاح مجانًا gpt-oss-120bnoneمتاح مجانًاvsOwl Alphamedium Seed-2.0-LitenonevsMiniMax M2.5mediumمتاح مجانًا