التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 2.5 Flash

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس DeepSeek: DeepSeek V3.2 medium الإصدار: 2025-12-01 Google: Gemini 2.5 Flash medium الإصدار: 2025-06-17
الترتيب #18 #16
متوسط الدرجة 6.98 7.05
الاتساق 8.75 9.39
التكلفة لكل نتيجة 0.193 2.762
إجمالي التكلفة $0.018 $0.249
اختبارات صحيحة
معدل النجاح لكل محاولة 71.4% 69.1%
اختبارات غير مستقرة 2 1
رموز الإخراج 6,753 975
رموز الاستدلال 30,427 96,701

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
DeepSeek: DeepSeek V3.2 7.00 9.86 66.7% 0 1,171 4,893
Google: Gemini 2.5 Flash 7.33 10.00 66.7% 0 249 8,832
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
DeepSeek: DeepSeek V3.2 9.88 10.00 100.0% 0 207 7,693
Google: Gemini 2.5 Flash 9.88 10.00 100.0% 0 279 2,325
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
DeepSeek: DeepSeek V3.2 4.00 7.21 44.4% 1 3,081 7,856
Google: Gemini 2.5 Flash 4.00 7.21 55.6% 1 18 80,702
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
DeepSeek: DeepSeek V3.2 7.00 9.84 50.0% 0 1,397 2,845
Google: Gemini 2.5 Flash 7.00 9.91 50.0% 0 69 1,203
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
DeepSeek: DeepSeek V3.2 7.00 7.21 88.9% 1 390 6,281
Google: Gemini 2.5 Flash 7.00 10.00 66.7% 0 126 2,499
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
DeepSeek: DeepSeek V3.2 10.00 10.00 100.0% 0 507 859
Google: Gemini 2.5 Flash 10.00 10.00 100.0% 0 234 1,140

مقارنة سريعة

تبديل زوج المقارنة