التنقل
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Mistral: Mistral Small 4

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-17

المقياس Gemini 3 Flash Preview Gemini 3 Flash Preview medium الإصدار: 2025-12-17 Mistral Small 4 Mistral Small 4 none الإصدار: 2026-03-16
الترتيب #1 #61
النتيجة 10.0 5.3
الاتساق 10.0 9.5
التكلفة لكل نتيجة 0.972 0.108
إجمالي التكلفة $0.166 $0.006
اختبارات صحيحة
معدل النجاح لكل محاولة 100.0% 33.3%
اختبارات غير مستقرة 0 1
إجمالي مرات التشغيل 51 51
رموز الإخراج 1,640 1,624
رموز الاستدلال 48,270 0
زمن الاستجابة (المتوسط) 11.39s 629ms
زمن الاستجابة (الحد الأقصى) 50.16s 1.72s
زمن الاستجابة (الإجمالي) 113.86s 10.70s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.13s 305 3,490
Mistral Small 4 3.4 7.9 16.7% 1 395ms 182 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 50.16s 351 12,645
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 496 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.72s 279 5,333
Mistral Small 4 10.0 10.0 100.0% 0 822ms 261 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 21.12s 12 14,908
Mistral Small 4 5.3 10.0 33.3% 0 367ms 28 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.09s 111 1,285
Mistral Small 4 4.0 10.0 0.0% 0 729ms 205 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.10s 72 4,558
Mistral Small 4 6.5 10.0 50.0% 0 380ms 69 0
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.43s 276 4,921
Mistral Small 4 3.1 9.9 0.0% 0 589ms 170 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 10.55s 234 1,130
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 213 0

مقارنة سريعة

تبديل زوج المقارنة