التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs MoonshotAI: Kimi K2.6

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-04

المقياس Seed-2.0-Lite Seed-2.0-Lite none الإصدار: 2026-02-14 Kimi K2.6 Kimi K2.6 none الإصدار: 2026-04-20 متاح مجانًا
النتيجة 5.8 5.5
الترتيب #110 #124
الموثوقية 10.0 10.0
الاتساق 8.4 9.2
اختبارات صحيحة
معدل النجاح لكل محاولة 46.0% 36.5%
اختبارات غير مستقرة 4 2
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 0.228 1.267
إجمالي التكلفة $0.019 $0.079
سعر الإدخال $0.250 / 1M $0.684 / 1M
سعر الإخراج $2.000 / 1M $3.420 / 1M
إجمالي رموز الإدخال 46,573 32,916
رموز الإخراج 3,259 16,410
رموز الاستدلال 0 0
زمن الاستجابة (المتوسط) 2.49s 13.27s
زمن الاستجابة (الحد الأقصى) 6.70s 238.89s
زمن الاستجابة (الإجمالي) 52.26s 278.57s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 894 709 0
Kimi K2.6 4.6 10.0 25.0% 0 1.39s 618 471 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Seed-2.0-Lite 5.6 10.0 33.3% 0 2.83s 8,215 410 0
Kimi K2.6 5.5 9.8 33.3% 0 82.57s 5,986 14,754 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 16,215 498 0
Kimi K2.6 3.0 10.0 0.0% 0 3.38s 11,269 290 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 8,538 246 0
Kimi K2.6 10.0 10.0 100.0% 0 1.32s 7,014 201 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 939 17 0
Kimi K2.6 5.3 7.2 44.4% 1 1.48s 732 42 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 570 294 0
Kimi K2.6 5.4 3.5 33.3% 1 1.55s 477 138 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 810 73 0
Kimi K2.6 6.5 10.0 50.0% 0 1.64s 669 72 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Seed-2.0-Lite 5.3 7.2 44.4% 1 2.78s 858 709 0
Kimi K2.6 3.1 9.9 0.0% 0 1.40s 651 185 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 9,270 292 0
Kimi K2.6 10.0 10.0 100.0% 0 4.46s 5,286 240 0
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Seed-2.0-Lite 3.0 10.0 0.0% 0 1.96s 264 11 0
Kimi K2.6 3.0 10.0 0.0% 0 1.36s 214 17 0

مقارنة سريعة

تبديل زوج المقارنة