التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 3.1 Flash Lite

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-29

المقياس DeepSeek V3.2 DeepSeek V3.2 none الإصدار: 2025-12-01 Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal الإصدار: 2026-05-08
النتيجة 6.2 6.7
الترتيب #97 #84
الموثوقية 10.0 10.0
الاتساق 8.3 8.8
اختبارات صحيحة
معدل النجاح لكل محاولة 48.3% 56.7%
اختبارات غير مستقرة 4 3
إجمالي مرات التشغيل 60 60
التكلفة لكل نتيجة 0.222 0.123
إجمالي التكلفة $0.018 $0.013
سعر الإدخال $0.252 / 1M $0.250 / 1M
سعر الإخراج $0.378 / 1M $1.500 / 1M
رموز الإخراج 11,159 2,481
رموز الاستدلال 0 0
زمن الاستجابة (المتوسط) 14.43s 1.37s
زمن الاستجابة (الحد الأقصى) 115.89s 4.49s
زمن الاستجابة (الإجمالي) 288.55s 27.32s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 3.8 8.2 12.5% 1 9.35s 1,073 0
Gemini 3.1 Flash Lite 8.3 10.0 75.0% 0 1.10s 639 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 3.1 5.4 16.7% 1 20.87s 4,522 0
Gemini 3.1 Flash Lite 6.8 10.0 50.0% 0 951ms 660 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 2,887 0
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.53s 357 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 1,710 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.04s 279 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 3.2 6.9 16.7% 1 4.17s 21 0
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 1.02s 15 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 10.0 10.0 100.0% 0 9.32s 43 0
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 791ms 63 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 66 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 932ms 72 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 10.0 10.0 100.0% 0 6.91s 298 0
Gemini 3.1 Flash Lite 6.0 4.6 66.7% 2 2.15s 153 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 522 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 3.51s 234 0
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 3.0 10.0 0.0% 0 17.23s 17 0
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 724ms 9 0

مقارنة سريعة

تبديل زوج المقارنة