التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Z.ai: GLM 5V Turbo

الملخص

مقارنة benchmark بين GPT-5.4 Mini و GLM 5V Turbo: يتقدم GLM 5V Turbo في متوسط النتيجة بـ 5.9 مقابل 5.3. لدى GPT-5.4 Mini تكلفة benchmark أقل عند $0.038 مقابل $0.052. GPT-5.4 Mini أسرع عند 1.13s مقابل 2.99s، مع معدلات نجاح 30.2% مقابل 38.1%.

النموذج الموصى به: GPT-5.4 Mini - Its score stays close to the best score here (5.3 vs 5.9), while responding about 2.6x faster than GLM 5V Turbo.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-17

المقياس GPT-5.4 Mini GPT-5.4 Mini none الإصدار: 2026-03-17 GLM 5V Turbo GLM 5V Turbo none الإصدار: 2026-04-01
النتيجة 5.3 5.9
الترتيب #123 #105
الموثوقية 10.0 10.0
الاتساق 8.8 10.0
اختبارات صحيحة
معدل النجاح لكل محاولة 30.2% 38.1%
اختبارات غير مستقرة 3 0
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 0.743 0.645
إجمالي التكلفة $0.038 $0.052
سعر الإدخال $0.750 / 1M $1.200 / 1M
سعر الإخراج $4.500 / 1M $4.000 / 1M
إجمالي رموز الإدخال 34,244 37,100
رموز الإخراج 2,541 1,766
رموز الاستدلال 0 0
زمن الاستجابة (المتوسط) 1.13s 2.99s
زمن الاستجابة (الحد الأقصى) 2.52s 6.51s
زمن الاستجابة (الإجمالي) 23.82s 62.74s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#123 GPT-5.4 Mini

none
Cost
$0.010
Time
11.7s
Tokens
2,151 tok

#105 GLM 5V Turbo

none
Cost
$0.042
Time
177.3s
Tokens
10,434 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 606 654 0
GLM 5V Turbo 4.8 10.0 25.0% 0 3.13s 555 281 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.4 Mini 5.5 10.0 33.3% 0 913ms 7,305 401 0
GLM 5V Turbo 5.5 10.0 33.3% 0 3.13s 7,256 360 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 11,019 298 0
GLM 5V Turbo 3.0 10.0 0.0% 0 6.51s 12,708 276 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 7,140 222 0
GLM 5V Turbo 10.0 10.0 100.0% 0 3.81s 7,107 204 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 723 88 0
GLM 5V Turbo 5.3 10.0 33.3% 0 2.09s 687 24 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 477 174 0
GLM 5V Turbo 4.6 10.0 0.0% 0 2.22s 477 114 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 660 101 0
GLM 5V Turbo 6.5 10.0 50.0% 0 1.97s 636 60 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.4 Mini 5.4 10.0 33.3% 0 836ms 642 305 0
GLM 5V Turbo 5.3 10.0 33.3% 0 2.40s 609 210 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 5,477 255 0
GLM 5V Turbo 10.0 10.0 100.0% 0 4.86s 6,879 222 0
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.4 Mini 3.0 10.0 0.0% 0 1.33s 195 43 0
GLM 5V Turbo 3.0 10.0 0.0% 0 2.23s 186 15 0

مقارنة سريعة

تبديل زوج المقارنة