التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Google: Gemma 4 31B

الملخص

مقارنة benchmark بين Gemini 3.1 Flash Lite Preview و Gemma 4 31B: يتقدم Gemini 3.1 Flash Lite Preview في متوسط النتيجة بـ 6.5 مقابل 6.1. لدى Gemma 4 31B تكلفة benchmark أقل عند $0.004 مقابل $0.026. Gemini 3.1 Flash Lite Preview أسرع عند 2.77s مقابل 4.05s، مع معدلات نجاح 61.9% مقابل 47.6%.

النموذج الموصى به: Gemma 4 31B - Its score stays close to the best score here (6.1 vs 6.5), while costing about 8.4x less than Gemini 3.1 Flash Lite Preview.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low الإصدار: 2026-03-03 Gemma 4 31B Gemma 4 31B none الإصدار: 2026-04-02 متاح مجانًا
النتيجة 6.5 6.1
الترتيب #82 #98
الموثوقية 10.0 10.0
الاتساق 10.0 10.0
اختبارات صحيحة
معدل النجاح لكل محاولة 61.9% 47.6%
اختبارات غير مستقرة 0 0
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 0.196 0.034
إجمالي التكلفة $0.026 $0.004
سعر الإدخال $0.250 / 1M $0.120 / 1M
سعر الإخراج $1.500 / 1M $0.350 / 1M
إجمالي رموز الإدخال 32,715 20,911
رموز الإخراج 2,286 1,407
رموز الاستدلال 9,166 0
زمن الاستجابة (المتوسط) 2.77s 4.05s
زمن الاستجابة (الحد الأقصى) 11.91s 26.13s
زمن الاستجابة (الإجمالي) 58.12s 76.87s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#82 Gemini 3.1 Flash Lite Preview

low
التكلفة
$0.002
الوقت
3.7s
الرموز
1,203 tok

#98 Gemma 4 31B

none
التكلفة
$0.001
الوقت
12.8s
الرموز
795 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 506 462 1,638
Gemma 4 31B 6.5 10.0 50.0% 0 1.85s 852 45 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 5.5 10.0 33.3% 0 1.39s 8,138 660 1,060
Gemma 4 31B 5.5 10.0 33.3% 0 11.19s 8,381 735 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 8,381 225 762
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 7,455 291 696
Gemma 4 31B 10.0 10.0 100.0% 0 2.25s 8,352 285 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 641 18 1,212
Gemma 4 31B 7.7 10.0 66.7% 0 3.22s 903 27 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 490 69 384
Gemma 4 31B 10.0 10.0 100.0% 0 2.09s 576 117 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 621 72 753
Gemma 4 31B 6.5 10.0 50.0% 0 2.84s 795 78 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.69s 566 243 1,248
Gemma 4 31B 6.5 10.0 33.3% 0 4.23s 828 108 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 5,757 237 993
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 1.35s 160 9 420
Gemma 4 31B 3.0 10.0 0.0% 0 1.25s 224 12 0

مقارنة سريعة

تبديل زوج المقارنة