التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Z.ai: GLM 5 Turbo

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-15

المقياس Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low الإصدار: 2026-03-03 GLM 5 Turbo GLM 5 Turbo medium الإصدار: 2026-03-15
الترتيب #21 #20
النتيجة 7.9 7.9
الاتساق 10.0 7.7
التكلفة لكل نتيجة 0.177 1.641
إجمالي التكلفة $0.020 $0.165
اختبارات صحيحة
معدل النجاح لكل محاولة 68.8% 75.0%
اختبارات غير مستقرة 0 5
إجمالي مرات التشغيل 48 48
رموز الإخراج 1,611 11,853
رموز الاستدلال 7,272 35,095
زمن الاستجابة (المتوسط) 3.36s 18.84s
زمن الاستجابة (الحد الأقصى) 11.91s 194.23s
زمن الاستجابة (الإجمالي) 53.84s 301.50s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 7.7 10.0 66.7% 0 2.18s 456 1,224
GLM 5 Turbo 10.0 10.0 100.0% 0 5.01s 350 2,600
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 225 762
GLM 5 Turbo 10.0 10.0 100.0% 0 13.88s 390 2,037
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 291 696
GLM 5 Turbo 10.0 10.0 100.0% 0 6.19s 577 3,632
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 18 1,212
GLM 5 Turbo 2.9 4.4 22.2% 2 71.07s 9,665 19,279
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 69 384
GLM 5 Turbo 6.1 3.1 66.7% 1 10.05s 60 2,216
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
GLM 5 Turbo 10.0 10.0 100.0% 0 5.38s 255 2,183
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.76s 243 1,248
GLM 5 Turbo 7.3 5.8 55.6% 2 5.44s 315 2,702
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993
GLM 5 Turbo 10.0 10.0 100.0% 0 9.84s 241 446

مقارنة سريعة

تبديل زوج المقارنة