قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs OpenAI: GPT-5.3-Codex

اسم النموذج:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في : 2026-02-27 15:16

الملخص

المقياس	ByteDance Seed: Seed-2.0-Mini medium الإصدار: 2026-02-26	OpenAI: GPT-5.3-Codex medium الإصدار: تاريخ الإصدار غير معروف
الترتيب	#18	#7
النتيجة	6.13	7.93
الاتساق	8.91	8.84
التكلفة لكل نتيجة	0.177	4.641
إجمالي التكلفة	$0.013	$0.465
اختبارات صحيحة
الاختبارات الخاطئة	7	4
معدل النجاح لكل محاولة	59.5%	78.6%
اختبارات غير مستقرة	2	2
رموز الإخراج	1,353	1,201
رموز الاستدلال	24,362	30,056

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini	7.00	9.99	66.7%	0		354	9,352
OpenAI: GPT-5.3-Codex	10.00	10.00	100.0%	0		216	1,421

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini	9.88	10.00	100.0%	0		246	2,743
OpenAI: GPT-5.3-Codex	10.00	10.00	100.0%	0		234	735

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini	1.00	10.00	0.0%	0		0	0
OpenAI: GPT-5.3-Codex	4.00	7.21	55.6%	1		64	25,308

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini	8.00	9.99	50.0%	0		69	2,050
OpenAI: GPT-5.3-Codex	9.00	10.00	50.0%	0		93	693

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini	5.33	4.91	77.8%	2		462	4,982
OpenAI: GPT-5.3-Codex	7.00	7.38	77.8%	1		340	1,407

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini	10.00	10.00	100.0%	0		222	5,235
OpenAI: GPT-5.3-Codex	10.00	10.00	100.0%	0		254	492

تبديل زوج المقارنة

قارن ByteDance Seed: Seed-2.0-Mini مع...

قارن OpenAI: GPT-5.3-Codex مع...