التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Google: Gemini 3.1 Flash Lite Preview

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-24

المقياس DeepSeek V4 Pro DeepSeek V4 Pro high الإصدار: 2026-04-24 Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low الإصدار: 2026-03-03
النتيجة 8.2 8.1
الترتيب #20 #26
الموثوقية غير متاح غير متاح
الاتساق 9.6 10.0
اختبارات صحيحة
معدل النجاح لكل محاولة 74.1% 72.2%
اختبارات غير مستقرة 1 0
إجمالي مرات التشغيل 24 54
التكلفة لكل نتيجة 1.224 0.168
إجمالي التكلفة $0.160 $0.022
??? ??????? $1.740 / 1M $0.250 / 1M
??? ??????? $3.480 / 1M $1.500 / 1M
رموز الإخراج 671 2,247
رموز الاستدلال 39,383 8,058
زمن الاستجابة (المتوسط) 71.21s 3.22s
زمن الاستجابة (الحد الأقصى) 351.99s 11.91s
زمن الاستجابة (الإجمالي) 1281.73s 58.00s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 8.3 10.0 75.0% 0 26.93s 70 2,008
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 462 1,638
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 10.0 10.0 100.0% 0 93.00s 82 2,808
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.20s 630 372
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 10.0 10.0 100.0% 0 71.08s 134 2,163
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 225 762
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 10.0 10.0 100.0% 0 63.00s 67 1,071
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 291 696
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 5.3 10.0 33.3% 0 202.56s 11 25,343
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 18 1,212
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 5.0 10.0 0.0% 0 26.96s 51 734
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 69 384
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 10.0 10.0 100.0% 0 14.60s 21 1,236
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 7.6 7.4 77.8% 1 69.69s 151 3,847
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.76s 243 1,248
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 10.0 10.0 100.0% 0 11.05s 84 173
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993

مقارنة سريعة

تبديل زوج المقارنة