التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Google: Gemini 3.1 Flash Lite

الملخص

مقارنة benchmark بين DeepSeek V4 Flash و Gemini 3.1 Flash Lite: يتقدم Gemini 3.1 Flash Lite في متوسط النتيجة بـ 6.1 مقابل 5.5. لدى DeepSeek V4 Flash تكلفة benchmark أقل عند $0.007 مقابل $0.013. Gemini 3.1 Flash Lite أسرع عند 1.06s مقابل 26.75s، مع معدلات نجاح 30.2% مقابل 52.4%.

النموذج الموصى به: Gemini 3.1 Flash Lite - It has the best score here (6.1), while responding about 25.1x faster than DeepSeek V4 Flash.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس DeepSeek V4 Flash DeepSeek V4 Flash none الإصدار: 2026-04-24 Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite none الإصدار: 2026-05-08
النتيجة 5.5 6.1
الترتيب #117 #96
الموثوقية 10.0 10.0
الاتساق 8.9 8.6
اختبارات صحيحة
معدل النجاح لكل محاولة 30.2% 52.4%
اختبارات غير مستقرة 3 4
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 0.203 0.144
إجمالي التكلفة $0.007 $0.013
سعر الإدخال $0.090 / 1M $0.250 / 1M
سعر الإخراج $0.180 / 1M $1.500 / 1M
إجمالي رموز الإدخال 50,127 36,710
رموز الإخراج 13,710 2,484
رموز الاستدلال 0 0
زمن الاستجابة (المتوسط) 26.75s 1.06s
زمن الاستجابة (الحد الأقصى) 111.96s 2.97s
زمن الاستجابة (الإجمالي) 561.82s 22.35s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 DeepSeek V4 Flash

none
التكلفة
$0.004
الوقت
157.6s
الرموز
11,297 tok

#96 Gemini 3.1 Flash Lite

none
التكلفة
$0.001
الوقت
4.5s
الرموز
727 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 3.0 10.0 0.0% 0 20.18s 540 174 0
Gemini 3.1 Flash Lite 7.5 8.4 66.7% 1 1.07s 506 639 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 4.2 7.4 11.1% 1 17.13s 7,279 9,717 0
Gemini 3.1 Flash Lite 5.5 10.0 33.3% 0 938ms 8,128 666 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 4.5 2.1 66.7% 1 111.96s 24,398 2,664 0
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.73s 12,870 357 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 10.0 10.0 100.0% 0 23.79s 7,290 195 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 843ms 7,267 279 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 5.3 10.0 33.3% 0 19.73s 666 18 0
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 762ms 647 15 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 4.2 9.9 0.0% 0 23.74s 471 67 0
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 992ms 486 63 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 6.5 10.0 50.0% 0 17.54s 627 321 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 859ms 619 72 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 3.1 7.3 11.1% 1 23.72s 594 207 0
Gemini 3.1 Flash Lite 6.3 4.8 66.7% 2 720ms 570 150 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 10.0 10.0 100.0% 0 77.93s 8,079 327 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.97s 5,457 234 0
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Flash 3.0 10.0 0.0% 0 3.07s 183 20 0
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 733ms 160 9 0

مقارنة سريعة

تبديل زوج المقارنة