AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5 Mini

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-12

المقياس	Seed-2.0-Lite Seed-2.0-Lite none الإصدار: 2026-02-14	GPT-5 Mini GPT-5 Mini medium الإصدار: 2025-08-07

المقياس	Seed-2.0-Lite Seed-2.0-Lite none الإصدار: 2026-02-14	GPT-5 Mini GPT-5 Mini medium الإصدار: 2025-08-07
الترتيب	#45	#34
متوسط الدرجة	4.9	6.0
الاتساق	7.4	8.9
التكلفة لكل نتيجة	0.214	1.457
إجمالي التكلفة	$0.015	$0.117
اختبارات صحيحة
معدل النجاح لكل محاولة	56.3%	58.3%
اختبارات غير مستقرة	5	2
إجمالي مرات التشغيل	48	48
رموز الإخراج	2,743	5,826
رموز الاستدلال	0	48,768
زمن الاستجابة (المتوسط)	2.49s	25.14s
زمن الاستجابة (الحد الأقصى)	6.70s	88.15s
زمن الاستجابة (الإجمالي)	39.91s	402.29s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

متوسط الدرجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

متوسط الدرجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	4.6	22.2%	2		2.93s	703	0
GPT-5 Mini	7.0	9.6	66.7%	0		16.45s	1,645	5,824

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	0.0%	0		6.59s	498	0
GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	754	11,520

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	9.9	10.0	100.0%	0		1.82s	246	0
GPT-5 Mini	9.9	10.0	100.0%	0		12.58s	453	3,200

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	7.2	22.2%	1		1.33s	17	0
GPT-5 Mini	10.0	7.2	22.2%	1		44.63s	293	14,016

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
GPT-5 Mini	4.0	10.0	0.0%	0		13.50s	349	1,856

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
GPT-5 Mini	7.5	6.6	83.3%	1		15.66s	318	4,992

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	4.0	4.4	55.6%	2		2.46s	620	0
GPT-5 Mini	4.3	9.8	33.3%	0		14.09s	1,527	5,760

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	487	1,600

مقارنة سريعة

تبديل زوج المقارنة

GPT-5 MinimediumvsGLM 5none Seed-2.0-LitenonevsGrok 4.20 Multi-Agent Betamedium Seed-2.0-Litenonevsgpt-oss-120bmediumمتاح مجانًا GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none Seed-2.0-LitenonevsMiniMax M2.5medium Seed-2.0-LitenonevsMercury 2medium DeepSeek V3.2nonevsGPT-5 Minimedium Seed-2.0-LitenonevsQwen3.5-35B-A3Bmedium Seed-2.0-LitenonevsGPT-5 Nanomedium Claude Sonnet 4.6nonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-Flashnone Gemini 2.5 FlashnonevsGPT-5 Minimedium