التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Mistral: Mistral Small 4 vs StepFun: Step 3.5 Flash

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-17

المقياس Mistral Small 4 Mistral Small 4 medium الإصدار: 2026-03-16 Step 3.5 Flash Step 3.5 Flash medium الإصدار: 2026-02-01 متاح مجانًا
الترتيب #55 #22
النتيجة 5.6 7.9
الاتساق 7.0 9.1
التكلفة لكل نتيجة 0.502 0.000
إجمالي التكلفة $0.026 $0.000
اختبارات صحيحة
معدل النجاح لكل محاولة 49.0% 70.6%
اختبارات غير مستقرة 6 2
إجمالي مرات التشغيل 51 49
رموز الإخراج 12,288 71,904
رموز الاستدلال 28,112 155,607
زمن الاستجابة (المتوسط) 4.18s 26.78s
زمن الاستجابة (الحد الأقصى) 25.25s 170.45s
زمن الاستجابة (الإجمالي) 71.03s 294.58s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 4,055 4,778
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 2,612 10,700
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 335 723
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 2,621 6,904
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 821 828
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 540 1,031
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 3.4 9.7 0.0% 0 2.00s 983 2,338
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 321 810
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

مقارنة سريعة

تبديل زوج المقارنة