التنقل
AI BENCHY
Your ad here

AI BENCHY Compare

Mistral: Mistral Small 4 vs OpenAI: GPT-4o-mini

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-17

المقياس Mistral Small 4 Mistral Small 4 none الإصدار: 2026-03-16 GPT-4o-mini GPT-4o-mini none الإصدار: 2024-07-18
الترتيب #61 #63
النتيجة 5.3 5.0
الاتساق 9.5 10.0
التكلفة لكل نتيجة 0.108 0.115
إجمالي التكلفة $0.006 $0.005
اختبارات صحيحة
معدل النجاح لكل محاولة 33.3% 23.5%
اختبارات غير مستقرة 1 0
إجمالي مرات التشغيل 51 51
رموز الإخراج 1,624 1,600
رموز الاستدلال 0 0
زمن الاستجابة (المتوسط) 629ms 1.94s
زمن الاستجابة (الحد الأقصى) 1.72s 7.58s
زمن الاستجابة (الإجمالي) 10.70s 19.44s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 3.4 7.9 16.7% 1 395ms 182 0
GPT-4o-mini 4.8 10.0 25.0% 0 1.34s 186 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 496 0
GPT-4o-mini 3.0 10.0 0.0% 0 7.58s 568 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 10.0 10.0 100.0% 0 822ms 261 0
GPT-4o-mini 10.0 10.0 100.0% 0 1.27s 183 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 5.3 10.0 33.3% 0 367ms 28 0
GPT-4o-mini 3.0 10.0 0.0% 0 637ms 15 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 4.0 10.0 0.0% 0 729ms 205 0
GPT-4o-mini 4.0 10.0 0.0% 0 909ms 66 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 6.5 10.0 50.0% 0 380ms 69 0
GPT-4o-mini 4.8 10.0 0.0% 0 1.27s 69 0
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 3.1 9.9 0.0% 0 589ms 170 0
GPT-4o-mini 3.7 10.0 0.0% 0 1.30s 308 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 213 0
GPT-4o-mini 10.0 10.0 100.0% 0 2.51s 205 0

مقارنة سريعة

تبديل زوج المقارنة