التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemma 4 31B vs StepFun: Step 3.7 Flash

الملخص

مقارنة benchmark بين Gemma 4 31B و Step 3.7 Flash: يتقدم Step 3.7 Flash في متوسط النتيجة بـ 8.5 مقابل 6.3. لدى Gemma 4 31B تكلفة benchmark أقل عند $0.033 مقابل $0.376. Step 3.7 Flash أسرع عند 20.35s مقابل 56.55s، مع معدلات نجاح 69.8% مقابل 73.0%.

النموذج الموصى به: Step 3.7 Flash - It has the best score here (8.5), while responding about 2.8x faster than Gemma 4 31B.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس Gemma 4 31B Gemma 4 31B medium الإصدار: 2026-04-02 متاح مجانًا Step 3.7 Flash Step 3.7 Flash medium الإصدار: 2026-05-29
النتيجة 6.3 8.5
الترتيب #88 #20
الموثوقية 10.0 9.9
الاتساق 9.4 9.3
اختبارات صحيحة
معدل النجاح لكل محاولة 69.8% 73.0%
اختبارات غير مستقرة 1 2
إجمالي مرات التشغيل 63 61
التكلفة لكل نتيجة 0.257 2.686
إجمالي التكلفة $0.033 $0.376
سعر الإدخال $0.120 / 1M $0.200 / 1M
سعر الإخراج $0.350 / 1M $1.150 / 1M
إجمالي رموز الإدخال 17,957 39,981
رموز الإخراج 22,356 319,958
رموز الاستدلال 65,726 0
زمن الاستجابة (المتوسط) 56.55s 20.35s
زمن الاستجابة (الحد الأقصى) 437.40s 113.98s
زمن الاستجابة (الإجمالي) 1074.41s 427.42s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#88 Gemma 4 31B

medium
التكلفة
$0.002
الوقت
45.7s
الرموز
2,696 tok

#20 Step 3.7 Flash

medium
التكلفة
$0.006
الوقت
46.2s
الرموز
4,466 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 816 962 2,046
Step 3.7 Flash 8.7 7.9 91.7% 1 9.65s 756 32,185 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 4.3 5.8 22.2% 1 219.76s 5,568 11,098 33,212
Step 3.7 Flash 8.8 7.8 88.9% 1 27.42s 7,437 44,797 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Step 3.7 Flash 10.0 10.0 100.0% 0 9.06s 13,683 7,106 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 8,334 1,822 2,951
Step 3.7 Flash 10.0 10.0 100.0% 0 2.75s 7,398 3,020 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 876 4,349 8,985
Step 3.7 Flash 7.7 10.0 66.7% 0 48.27s 708 70,347 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 567 105 888
Step 3.7 Flash 4.0 10.0 0.0% 0 6.85s 525 3,987 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 777 533 2,035
Step 3.7 Flash 9.8 10.0 100.0% 0 1.83s 735 2,166 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 9.9 10.0 100.0% 0 26.91s 801 1,795 5,595
Step 3.7 Flash 5.7 9.9 33.3% 0 6.19s 756 15,071 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Step 3.7 Flash 10.0 10.0 100.0% 0 4.16s 7,746 2,115 0
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 218 1,692 10,014
Step 3.7 Flash 3.0 10.0 0.0% 0 113.98s 237 139,164 0

مقارنة سريعة

تبديل زوج المقارنة