التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs Google: Gemini 3.1 Pro Preview

اسم النموذج:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في : 2026-02-27 15:16

الملخص

المقياس ByteDance Seed: Seed-2.0-Mini medium الإصدار: 2026-02-26 Google: Gemini 3.1 Pro Preview medium الإصدار: تاريخ الإصدار غير معروف
الترتيب #18 #2
النتيجة 6.13 9.36
الاتساق 8.91 10.00
التكلفة لكل نتيجة 0.177 2.443
إجمالي التكلفة $0.013 $0.318
اختبارات صحيحة
الاختبارات الخاطئة 7 1
معدل النجاح لكل محاولة 59.5% 92.9%
اختبارات غير مستقرة 2 0
رموز الإخراج 1,353 1,000
رموز الاستدلال 24,362 22,936

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini 7.00 9.99 66.7% 0 354 9,352
Google: Gemini 3.1 Pro Preview 10.00 10.00 100.0% 0 106 2,533
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini 9.88 10.00 100.0% 0 246 2,743
Google: Gemini 3.1 Pro Preview 10.00 10.00 100.0% 0 292 3,164
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini 1.00 10.00 0.0% 0 0 0
Google: Gemini 3.1 Pro Preview 7.00 10.00 66.7% 0 18 10,688
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini 8.00 9.99 50.0% 0 69 2,050
Google: Gemini 3.1 Pro Preview 10.00 10.00 100.0% 0 72 2,436
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini 5.33 4.91 77.8% 2 462 4,982
Google: Gemini 3.1 Pro Preview 10.00 10.00 100.0% 0 238 3,133
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini 10.00 10.00 100.0% 0 222 5,235
Google: Gemini 3.1 Pro Preview 10.00 10.00 100.0% 0 274 982

تبديل زوج المقارنة