التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

xAI: Grok 4.20 vs Z.ai: GLM 5.1

الملخص

مقارنة benchmark بين Grok 4.20 و GLM 5.1: يتقدم Grok 4.20 في متوسط النتيجة بـ 7.3 مقابل 7.1. لدى GLM 5.1 تكلفة benchmark أقل عند $0.292 مقابل $0.609. Grok 4.20 أسرع عند 27.68s مقابل 33.67s، مع معدلات نجاح 63.5% مقابل 68.3%.

النموذج الموصى به: GLM 5.1 - Its score stays close to the best score here (7.1 vs 7.3), while costing about 2.1x less than Grok 4.20.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس Grok 4.20 Grok 4.20 medium الإصدار: 2026-03-31 GLM 5.1 GLM 5.1 medium الإصدار: 2026-04-07
النتيجة 7.3 7.1
الترتيب #53 #64
الموثوقية 10.0 6.7
الاتساق 8.8 8.3
اختبارات صحيحة
معدل النجاح لكل محاولة 63.5% 68.3%
اختبارات غير مستقرة 3 4
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 8.309 2.496
إجمالي التكلفة $0.609 $0.292
سعر الإدخال $1.250 / 1M $0.980 / 1M
سعر الإخراج $2.500 / 1M $3.080 / 1M
إجمالي رموز الإدخال 44,433 32,995
رموز الإخراج 1,819 11,655
رموز الاستدلال 219,524 75,421
زمن الاستجابة (المتوسط) 27.68s 33.67s
زمن الاستجابة (الحد الأقصى) 199.66s 172.60s
زمن الاستجابة (الإجمالي) 581.26s 673.41s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#53 xAI: Grok 4.20

medium
التكلفة
$0.041
الوقت
110.3s
الرموز
16,336 tok

#64 GLM 5.1

medium
SVG غير صالح
التكلفة
$0.000
الوقت
300.0s
الرموز
0 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 8.2 7.9 83.3% 1 3.95s 2,010 287 8,312
GLM 5.1 10.0 10.0 100.0% 0 8.31s 555 401 5,122
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 6.3 6.6 55.6% 1 109.93s 8,307 268 103,150
GLM 5.1 4.6 3.7 44.5% 2 109.63s 5,702 4,871 37,826
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 10.0 10.0 100.0% 0 17.40s 12,909 232 9,556
GLM 5.1 9.5 10.0 100.0% 0 43.11s 17,298 327 4,206
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 10.0 10.0 100.0% 0 4.17s 7,761 180 5,333
GLM 5.1 10.0 10.0 100.0% 0 9.33s 7,107 991 4,552
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 5.3 10.0 33.3% 0 27.03s 1,764 375 49,339
GLM 5.1 5.3 10.0 33.3% 0 29.77s 489 969 11,314
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 3.9 2.6 33.3% 1 24.48s 825 65 6,440
GLM 5.1 10.0 10.0 100.0% 0 20.95s 477 2,875 2,875
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 9.8 10.0 100.0% 0 4.26s 1,362 57 6,419
GLM 5.1 6.4 5.8 66.7% 1 7.47s 634 204 1,617
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 7.7 10.0 66.7% 0 6.22s 1,689 149 7,913
GLM 5.1 8.2 7.2 88.9% 1 31.64s 609 935 5,730
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 3.0 10.0 0.0% 0 13.68s 7,275 197 6,620
GLM 5.1 3.0 10.0 0.0% 0 0ms 0 0 0
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 3.0 10.0 0.0% 0 63.48s 531 9 16,442
GLM 5.1 3.0 10.0 0.0% 0 29.40s 124 82 2,179

مقارنة سريعة

تبديل زوج المقارنة