التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Google: Gemini 2.5 Flash vs StepFun: Step 3.5 Flash

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس Google: Gemini 2.5 Flash none الإصدار: 2025-06-17 StepFun: Step 3.5 Flash medium الإصدار: 2026-02-01 متاح مجانًا
الترتيب #36 #17
متوسط الدرجة 5.34 7.00
الاتساق 9.40 8.32
التكلفة لكل نتيجة 0.107 0.000
إجمالي التكلفة $0.007 $0.000
اختبارات صحيحة
معدل النجاح لكل محاولة 47.6% 73.8%
اختبارات غير مستقرة 1 3
رموز الإخراج 826 60,502
رموز الاستدلال 0 117,044

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 1.00 10.00 0.0% 0 99 0
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 13,924 17,208
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 9.88 10.00 100.0% 0 279 0
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 535 11,548
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 4.00 7.21 55.6% 1 12 0
StepFun: Step 3.5 Flash 4.00 7.21 44.4% 1 40,942 74,237
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 8.00 9.99 50.0% 0 70 0
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 2,121 3,274
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 4.67 10.00 33.3% 0 132 0
StepFun: Step 3.5 Flash 2.00 4.96 33.3% 2 2,705 6,975
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 10.00 10.00 100.0% 0 234 0
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 275 3,802

مقارنة سريعة

تبديل زوج المقارنة