التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

xAI: Grok 4.20 vs Z.ai: GLM 4.7 Flash

الملخص

مقارنة benchmark بين Grok 4.20 و GLM 4.7 Flash: يتقدم Grok 4.20 في متوسط النتيجة بـ 4.4 مقابل 4.3. لدى GLM 4.7 Flash تكلفة benchmark أقل عند $0.054 مقابل $0.057. Grok 4.20 أسرع عند 1.11s مقابل 35.10s، مع معدلات نجاح 28.6% مقابل 33.3%.

النموذج الموصى به: Grok 4.20 - It has the best score here (4.4), while responding about 31.6x faster than GLM 4.7 Flash.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-02

المقياس Grok 4.20 Grok 4.20 none الإصدار: 2026-03-31 GLM 4.7 Flash GLM 4.7 Flash medium الإصدار: 2026-01-19
النتيجة 4.4 4.3
الترتيب #160 #162
الموثوقية غير متاح 6.7
الاتساق 8.5 6.8
اختبارات صحيحة
معدل النجاح لكل محاولة 28.6% 33.3%
اختبارات غير مستقرة 0 8
إجمالي مرات التشغيل 54 63
التكلفة لكل نتيجة 1.570 1.337
إجمالي التكلفة $0.057 $0.054
سعر الإدخال $1.250 / 1M $0.060 / 1M
سعر الإخراج $2.500 / 1M $0.400 / 1M
إجمالي رموز الإدخال 41,313 37,206
رموز الإخراج 1,923 43,754
رموز الاستدلال 0 89,079
زمن الاستجابة (المتوسط) 1.11s 35.10s
زمن الاستجابة (الحد الأقصى) 6.04s 174.55s
زمن الاستجابة (الإجمالي) 19.96s 456.24s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#160 xAI: Grok 4.20

none
التكلفة
$0.004
الوقت
6.5s
الرموز
1,367 tok

#162 GLM 4.7 Flash

medium
SVG غير صالح
التكلفة
$0.000
الوقت
186.2s
الرموز
12,112 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 4.8 10.0 25.0% 0 501ms 1,986 267 0
GLM 4.7 Flash 4.7 5.9 41.7% 2 14.95s 555 1,122 6,110
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 1.1 3.1 0.0% 0 1.22s 1,074 312 0
GLM 4.7 Flash 3.2 7.4 11.1% 1 55.33s 3,106 4,981 22,387
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 3.0 10.0 0.0% 0 6.04s 17,673 282 0
GLM 4.7 Flash 2.8 2.1 33.3% 1 65.57s 17,185 2,585 20,648
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 10.0 10.0 100.0% 0 522ms 7,749 207 0
GLM 4.7 Flash 6.3 10.0 50.0% 0 1.51s 7,107 584 2,755
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 3.0 10.0 0.0% 0 687ms 1,746 325 0
GLM 4.7 Flash 3.5 4.4 33.3% 2 174.55s 643 33,000 25,394
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 4.8 10.0 0.0% 0 659ms 819 83 0
GLM 4.7 Flash 3.6 9.7 0.0% 0 18.14s 318 18 2,138
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 6.3 10.0 50.0% 0 445ms 1,350 60 0
GLM 4.7 Flash 6.2 5.8 66.7% 1 2.97s 636 388 2,181
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 5.3 10.0 33.3% 0 473ms 1,671 198 0
GLM 4.7 Flash 2.9 7.2 11.1% 1 12.93s 521 781 5,255
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 10.0 10.0 100.0% 0 4.63s 7,245 189 0
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 6,949 224 1,014
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Grok 4.20 0.0 0.0 0.0% 0 0ms 0 0 0
GLM 4.7 Flash 3.0 10.0 0.0% 0 11.13s 186 71 1,197

مقارنة سريعة

تبديل زوج المقارنة