التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Z.ai: GLM 5 Turbo

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-17

المقياس Seed-2.0-Lite Seed-2.0-Lite medium الإصدار: 2026-02-14 GLM 5 Turbo GLM 5 Turbo medium الإصدار: 2026-03-15
الترتيب #5 #16
النتيجة 8.5 8.0
الاتساق 8.8 7.9
التكلفة لكل نتيجة 0.873 1.509
إجمالي التكلفة $0.105 $0.166
اختبارات صحيحة
معدل النجاح لكل محاولة 82.4% 76.5%
اختبارات غير مستقرة 3 5
إجمالي مرات التشغيل 51 51
رموز الإخراج 2,821 11,865
رموز الاستدلال 44,723 35,632
زمن الاستجابة (المتوسط) 27.78s 17.98s
زمن الاستجابة (الحد الأقصى) 168.71s 194.23s
زمن الاستجابة (الإجمالي) 472.24s 305.72s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 996 7,142
GLM 5 Turbo 10.0 10.0 100.0% 0 4.82s 362 3,137
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
GLM 5 Turbo 10.0 10.0 100.0% 0 13.88s 390 2,037
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 246 1,742
GLM 5 Turbo 10.0 10.0 100.0% 0 6.19s 577 3,632
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 15 23,897
GLM 5 Turbo 2.9 4.4 22.2% 2 71.07s 9,665 19,279
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 304 1,620
GLM 5 Turbo 6.1 3.1 66.7% 1 10.05s 60 2,216
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
GLM 5 Turbo 10.0 10.0 100.0% 0 5.38s 255 2,183
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Seed-2.0-Lite 9.0 7.9 88.9% 1 11.03s 461 3,532
GLM 5 Turbo 7.3 5.8 55.6% 2 5.44s 315 2,702
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
GLM 5 Turbo 10.0 10.0 100.0% 0 9.84s 241 446

مقارنة سريعة

تبديل زوج المقارنة