التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

StepFun: Step 3.7 Flash vs Z.ai: GLM 5 Turbo

الملخص

مقارنة benchmark بين Step 3.7 Flash و GLM 5 Turbo: يتقدم GLM 5 Turbo في متوسط النتيجة بـ 8.4 مقابل 7.7. لدى GLM 5 Turbo تكلفة benchmark أقل عند $0.323 مقابل $0.341. Step 3.7 Flash أسرع عند 15.74s مقابل 23.00s، مع معدلات نجاح 68.3% مقابل 74.6%.

النموذج الموصى به: GLM 5 Turbo - It has the strongest score in this comparison (8.4) and the best overall balance of cost and response time across all 2 models.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس Step 3.7 Flash Step 3.7 Flash low الإصدار: 2026-05-29 GLM 5 Turbo GLM 5 Turbo medium الإصدار: 2026-03-15
النتيجة 7.7 8.4
الترتيب #39 #21
الموثوقية 10.0 10.0
الاتساق 8.4 8.5
اختبارات صحيحة
معدل النجاح لكل محاولة 68.3% 74.6%
اختبارات غير مستقرة 4 4
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 2.840 2.011
إجمالي التكلفة $0.341 $0.323
سعر الإدخال $0.200 / 1M $1.200 / 1M
سعر الإخراج $1.150 / 1M $4.000 / 1M
إجمالي رموز الإدخال 40,101 35,593
رموز الإخراج 289,325 12,245
رموز الاستدلال 0 62,277
زمن الاستجابة (المتوسط) 15.74s 23.00s
زمن الاستجابة (الحد الأقصى) 124.75s 194.23s
زمن الاستجابة (الإجمالي) 330.63s 482.97s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#39 Step 3.7 Flash

low
SVG غير صالح
التكلفة
$0.004
الوقت
25.3s
الرموز
3,072 tok

#21 GLM 5 Turbo

medium
التكلفة
$0.074
الوقت
206.0s
الرموز
18,549 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 756 10,896 0
GLM 5 Turbo 10.0 10.0 100.0% 0 4.82s 555 362 3,137
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Step 3.7 Flash 8.2 7.2 88.9% 1 9.46s 7,437 18,685 0
GLM 5 Turbo 8.2 9.3 66.7% 0 45.90s 5,941 363 25,381
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 13,683 6,426 0
GLM 5 Turbo 10.0 10.0 100.0% 0 13.88s 12,714 390 2,037
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 7,398 2,667 0
GLM 5 Turbo 10.0 10.0 100.0% 0 6.19s 7,107 577 3,632
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 828 104,487 0
GLM 5 Turbo 2.9 4.4 22.2% 2 71.07s 489 9,665 19,279
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 525 4,604 0
GLM 5 Turbo 6.1 3.1 66.7% 1 10.05s 477 60 2,216
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 735 1,857 0
GLM 5 Turbo 10.0 10.0 100.0% 0 5.38s 636 255 2,183
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 756 3,564 0
GLM 5 Turbo 8.7 7.9 77.8% 1 5.23s 609 312 2,647
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 7,746 1,360 0
GLM 5 Turbo 10.0 10.0 100.0% 0 9.84s 6,879 241 446
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 237 134,779 0
GLM 5 Turbo 3.0 10.0 0.0% 0 40.17s 186 20 1,319

مقارنة سريعة

تبديل زوج المقارنة