التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
Your ad here

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 3.1 Flash Lite Preview

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس DeepSeek: DeepSeek V3.2 medium الإصدار: 2025-12-01 Google: Gemini 3.1 Flash Lite Preview medium الإصدار: 2026-03-03
الترتيب #18 #20
متوسط الدرجة 6.98 6.91
الاتساق 8.75 10.00
التكلفة لكل نتيجة 0.193 0.392
إجمالي التكلفة $0.018 $0.032
اختبارات صحيحة
معدل النجاح لكل محاولة 71.4% 57.1%
اختبارات غير مستقرة 2 0
رموز الإخراج 6,753 1,308
رموز الاستدلال 30,427 16,986

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
DeepSeek: DeepSeek V3.2 7.00 9.86 66.7% 0 1,171 4,893
Google: Gemini 3.1 Flash Lite Preview 9.00 9.99 66.7% 0 564 3,780
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
DeepSeek: DeepSeek V3.2 9.88 10.00 100.0% 0 207 7,693
Google: Gemini 3.1 Flash Lite Preview 9.88 10.00 100.0% 0 279 2,952
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
DeepSeek: DeepSeek V3.2 4.00 7.21 44.4% 1 3,081 7,856
Google: Gemini 3.1 Flash Lite Preview 1.00 10.00 0.0% 0 18 5,325
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
DeepSeek: DeepSeek V3.2 7.00 9.84 50.0% 0 1,397 2,845
Google: Gemini 3.1 Flash Lite Preview 8.00 9.99 50.0% 0 72 2,121
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
DeepSeek: DeepSeek V3.2 7.00 7.21 88.9% 1 390 6,281
Google: Gemini 3.1 Flash Lite Preview 7.00 10.00 66.7% 0 141 1,896
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
DeepSeek: DeepSeek V3.2 10.00 10.00 100.0% 0 507 859
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 234 912

مقارنة سريعة

تبديل زوج المقارنة