التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs Google: Gemini 2.5 Flash

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس ByteDance Seed: Seed-2.0-Mini medium الإصدار: 2026-02-14 Google: Gemini 2.5 Flash none الإصدار: 2025-06-17
الترتيب #26 #36
متوسط الدرجة 6.13 5.34
الاتساق 8.91 9.40
التكلفة لكل نتيجة 0.177 0.107
إجمالي التكلفة $0.013 $0.007
اختبارات صحيحة
معدل النجاح لكل محاولة 59.5% 47.6%
اختبارات غير مستقرة 2 1
رموز الإخراج 1,353 826
رموز الاستدلال 24,362 0

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini 7.00 9.99 66.7% 0 354 9,352
Google: Gemini 2.5 Flash 1.00 10.00 0.0% 0 99 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini 9.88 10.00 100.0% 0 246 2,743
Google: Gemini 2.5 Flash 9.88 10.00 100.0% 0 279 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini 1.00 10.00 0.0% 0 0 0
Google: Gemini 2.5 Flash 4.00 7.21 55.6% 1 12 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini 8.00 9.99 50.0% 0 69 2,050
Google: Gemini 2.5 Flash 8.00 9.99 50.0% 0 70 0
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini 5.33 4.91 77.8% 2 462 4,982
Google: Gemini 2.5 Flash 4.67 10.00 33.3% 0 132 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
ByteDance Seed: Seed-2.0-Mini 10.00 10.00 100.0% 0 222 5,235
Google: Gemini 2.5 Flash 10.00 10.00 100.0% 0 234 0

مقارنة سريعة

تبديل زوج المقارنة