التنقل
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Google: Gemini 3.1 Pro Preview

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-16

المقياس Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview high الإصدار: 2026-03-03 Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium الإصدار: 2026-02-19
النتيجة 8.4 9.6
الترتيب #11 #2
الاتساق 9.6 10.0
اختبارات صحيحة
معدل النجاح لكل محاولة 77.1% 94.4%
اختبارات غير مستقرة 1 0
إجمالي مرات التشغيل 48 54
التكلفة لكل نتيجة 19.243 3.400
إجمالي التكلفة $2.310 $0.578
??? ??????? $0.250 / 1M $2.000 / 1M
??? ??????? $1.500 / 1M $12.000 / 1M
رموز الإخراج 1,283 1,932
رموز الاستدلال 1,533,310 40,542
زمن الاستجابة (المتوسط) 68.83s 15.96s
زمن الاستجابة (الحد الأقصى) 280.52s 40.61s
زمن الاستجابة (الإجمالي) 1101.32s 175.52s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 43.87s 144 193,077
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 280.52s 335 380,440
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 7.16s 279 6,186
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 127.58s 18 566,202
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 5.25s 117 3,915
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 7.9 6.9 66.7% 1 70.07s 69 190,053
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 7.7 10.0 66.7% 0 46.33s 87 190,953
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 7.73s 234 2,484
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview - - - - - - - -
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201

مقارنة سريعة

تبديل زوج المقارنة