التنقل
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs StepFun: Step 3.5 Flash

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-11

المقياس Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium الإصدار: 2026-02-19 Step 3.5 Flash Step 3.5 Flash none الإصدار: 2026-02-01
النتيجة 9.6 3.0
الترتيب #2 #93
الاتساق 10.0 10.0
اختبارات صحيحة
معدل النجاح لكل محاولة 94.4% 0.0%
اختبارات غير مستقرة 0 0
إجمالي مرات التشغيل 54 3
التكلفة لكل نتيجة 3.400 0.000
إجمالي التكلفة $0.578 $0.000
??? ??????? $2.000 / 1M $0.100 / 1M
??? ??????? $12.000 / 1M $0.300 / 1M
رموز الإخراج 1,932 0
رموز الاستدلال 40,542 0
زمن الاستجابة (المتوسط) 15.96s 0ms
زمن الاستجابة (الحد الأقصى) 40.61s 0ms
زمن الاستجابة (الإجمالي) 175.52s 0ms

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
Step 3.5 Flash - - - - - - - -
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
Step 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
Step 3.5 Flash - - - - - - - -
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
Step 3.5 Flash - - - - - - - -
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Step 3.5 Flash - - - - - - - -
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
Step 3.5 Flash - - - - - - - -
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Step 3.5 Flash - - - - - - - -
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
Step 3.5 Flash - - - - - - - -
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
Step 3.5 Flash - - - - - - - -

مقارنة سريعة

تبديل زوج المقارنة