قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs OpenAI: GPT-5.2

اسم النموذج:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في : 2026-02-27 15:16

الملخص

المقياس	ByteDance Seed: Seed-2.0-Mini medium الإصدار: 2026-02-26	OpenAI: GPT-5.2 medium الإصدار: تاريخ الإصدار غير معروف
الترتيب	#18	#12
النتيجة	6.13	6.93
الاتساق	8.91	8.22
التكلفة لكل نتيجة	0.177	2.780
إجمالي التكلفة	$0.013	$0.251
اختبارات صحيحة
الاختبارات الخاطئة	7	5
معدل النجاح لكل محاولة	59.5%	76.2%
اختبارات غير مستقرة	2	3
رموز الإخراج	1,353	1,869
رموز الاستدلال	24,362	14,190

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini	7.00	9.99	66.7%	0		354	9,352
OpenAI: GPT-5.2	7.00	7.28	77.8%	1		549	2,002

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini	9.88	10.00	100.0%	0		246	2,743
OpenAI: GPT-5.2	10.00	10.00	100.0%	0		234	499

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini	1.00	10.00	0.0%	0		0	0
OpenAI: GPT-5.2	4.00	7.21	55.6%	1		42	9,690

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini	8.00	9.99	50.0%	0		69	2,050
OpenAI: GPT-5.2	9.50	10.00	100.0%	0		95	587

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini	5.33	4.91	77.8%	2		462	4,982
OpenAI: GPT-5.2	8.00	10.00	66.7%	0		710	943

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini	10.00	10.00	100.0%	0		222	5,235
OpenAI: GPT-5.2	1.00	1.62	66.7%	1		239	469

تبديل زوج المقارنة

قارن ByteDance Seed: Seed-2.0-Mini مع...

قارن OpenAI: GPT-5.2 مع...