التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 2.5 Flash vs Z.ai: GLM 4.7 Flash

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس Google: Gemini 2.5 Flash none الإصدار: 2025-06-17 Z.ai: GLM 4.7 Flash medium الإصدار: 2026-01-19
الترتيب #36 #43
متوسط الدرجة 5.34 4.14
الاتساق 9.40 6.42
التكلفة لكل نتيجة 0.107 0.227
إجمالي التكلفة $0.007 $0.012
اختبارات صحيحة
معدل النجاح لكل محاولة 47.6% 52.4%
اختبارات غير مستقرة 1 6
رموز الإخراج 826 8,003
رموز الاستدلال 0 22,680

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 1.00 10.00 0.0% 0 99 0
Z.ai: GLM 4.7 Flash 4.00 4.48 55.6% 2 1,085 5,597
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 9.88 10.00 100.0% 0 279 0
Z.ai: GLM 4.7 Flash 10.00 10.00 100.0% 0 1,073 4,920
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 4.00 7.21 55.6% 1 12 0
Z.ai: GLM 4.7 Flash 1.00 4.41 33.3% 2 4,499 4,743
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 8.00 9.99 50.0% 0 70 0
Z.ai: GLM 4.7 Flash 5.00 5.81 66.7% 1 380 2,141
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 4.67 10.00 33.3% 0 132 0
Z.ai: GLM 4.7 Flash 1.00 7.20 11.1% 1 742 4,265
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 10.00 10.00 100.0% 0 234 0
Z.ai: GLM 4.7 Flash 10.00 10.00 100.0% 0 224 1,014

مقارنة سريعة

تبديل زوج المقارنة