التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Google: Gemini 3.1 Flash Lite Preview

الملخص

مقارنة benchmark بين DeepSeek V4 Pro و Gemini 3.1 Flash Lite Preview: يتقدم Gemini 3.1 Flash Lite Preview في متوسط النتيجة بـ 6.5 مقابل 6.2. لدى DeepSeek V4 Pro تكلفة benchmark أقل عند $0.025 مقابل $0.026. Gemini 3.1 Flash Lite Preview أسرع عند 2.77s مقابل 12.38s، مع معدلات نجاح 42.9% مقابل 61.9%.

النموذج الموصى به: Gemini 3.1 Flash Lite Preview - It has the best score here (6.5), while responding about 4.5x faster than DeepSeek V4 Pro.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-12

المقياس DeepSeek V4 Pro DeepSeek V4 Pro none الإصدار: 2026-04-24 Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low الإصدار: 2026-03-03
النتيجة 6.2 6.5
الترتيب #91 #81
الموثوقية 8.5 10.0
الاتساق 8.5 10.0
اختبارات صحيحة
معدل النجاح لكل محاولة 42.9% 61.9%
اختبارات غير مستقرة 4 0
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 0.660 0.196
إجمالي التكلفة $0.025 $0.026
سعر الإدخال $0.435 / 1M $0.250 / 1M
سعر الإخراج $0.870 / 1M $1.500 / 1M
إجمالي رموز الإدخال 44,845 32,715
رموز الإخراج 5,349 2,286
رموز الاستدلال 0 9,166
زمن الاستجابة (المتوسط) 12.38s 2.77s
زمن الاستجابة (الحد الأقصى) 58.65s 11.91s
زمن الاستجابة (الإجمالي) 260.06s 58.12s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#91 DeepSeek V4 Pro

none
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

#81 Gemini 3.1 Flash Lite Preview

low
Cost
$0.002
Time
3.7s
Tokens
1,203 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 3.5 8.0 16.7% 1 14.02s 540 704 0
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 506 462 1,638
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 4.6 7.9 22.2% 1 6.11s 7,279 531 0
Gemini 3.1 Flash Lite Preview 5.5 10.0 33.3% 0 1.39s 8,138 660 1,060
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 9.5 10.0 100.0% 0 25.49s 20,773 1,911 0
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 8,381 225 762
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 6.9 5.8 66.7% 1 30.54s 5,633 170 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 7,455 291 696
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 5.3 10.0 33.3% 0 3.17s 666 18 0
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 641 18 1,212
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 4.3 9.9 0.0% 0 3.75s 471 132 0
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 490 69 384
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 6.3 10.0 50.0% 0 8.23s 627 64 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 621 72 753
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 7.6 7.2 77.8% 1 15.95s 594 173 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.69s 566 243 1,248
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 10.0 10.0 100.0% 0 5.92s 8,079 219 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 5,757 237 993
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
DeepSeek V4 Pro 3.0 10.0 0.0% 0 15.59s 183 1,427 0
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 1.35s 160 9 420

مقارنة سريعة

تبديل زوج المقارنة