التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 2.5 Flash

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-16

المقياس DeepSeek V3.2 DeepSeek V3.2 none الإصدار: 2025-12-01 Gemini 2.5 Flash Gemini 2.5 Flash none الإصدار: 2025-06-17
النتيجة 6.1 6.2
الترتيب #63 #61
الاتساق 8.1 9.2
اختبارات صحيحة
معدل النجاح لكل محاولة 50.0% 44.4%
اختبارات غير مستقرة 4 2
إجمالي مرات التشغيل 54 54
التكلفة لكل نتيجة 0.226 0.184
إجمالي التكلفة $0.016 $0.013
??? ??????? $0.260 / 1M $0.300 / 1M
??? ??????? $0.380 / 1M $2.500 / 1M
رموز الإخراج 8,384 1,726
رموز الاستدلال 0 0
زمن الاستجابة (المتوسط) 12.09s 903ms
زمن الاستجابة (الحد الأقصى) 115.89s 4.39s
زمن الاستجابة (الإجمالي) 217.56s 16.26s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 3.2 9.8 0.0% 0 7.63s 1,419 0
Gemini 2.5 Flash 3.0 10.0 0.0% 0 582ms 102 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 2.4 1.3 33.3% 1 7.63s 553 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.16s 453 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 2,887 0
Gemini 2.5 Flash 3.0 10.0 0.0% 0 4.39s 366 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 1,710 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 652ms 279 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 3.6 7.2 22.2% 1 1.61s 24 0
Gemini 2.5 Flash 5.9 7.2 55.6% 1 495ms 12 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 10.0 10.0 100.0% 0 2.86s 67 0
Gemini 2.5 Flash 5.0 10.0 0.0% 0 615ms 78 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 66 0
Gemini 2.5 Flash 8.0 6.8 66.7% 1 672ms 70 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 8.5 7.5 88.9% 1 7.37s 1,136 0
Gemini 2.5 Flash 5.7 10.0 33.3% 0 576ms 132 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 522 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 234 0

مقارنة سريعة

تبديل زوج المقارنة