التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Google: Gemini 3.1 Pro Preview

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس Google: Gemini 3.1 Flash Lite Preview low الإصدار: 2026-03-03 Google: Gemini 3.1 Pro Preview medium الإصدار: 2026-02-19
الترتيب #8 #2
متوسط الدرجة 7.84 9.36
الاتساق 10.00 10.00
التكلفة لكل نتيجة 0.151 2.443
إجمالي التكلفة $0.016 $0.318
اختبارات صحيحة
معدل النجاح لكل محاولة 71.4% 92.9%
اختبارات غير مستقرة 0 0
رموز الإخراج 1,317 1,000
رموز الاستدلال 6,126 22,936

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 7.00 10.00 66.7% 0 456 1,224
Google: Gemini 3.1 Pro Preview 10.00 10.00 100.0% 0 106 2,533
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 9.88 10.00 100.0% 0 291 696
Google: Gemini 3.1 Pro Preview 10.00 10.00 100.0% 0 292 3,164
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 4.00 10.00 33.3% 0 18 1,212
Google: Gemini 3.1 Pro Preview 7.00 10.00 66.7% 0 18 10,688
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 8.50 10.00 50.0% 0 72 753
Google: Gemini 3.1 Pro Preview 10.00 10.00 100.0% 0 72 2,436
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 243 1,248
Google: Gemini 3.1 Pro Preview 10.00 10.00 100.0% 0 238 3,133
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 237 993
Google: Gemini 3.1 Pro Preview 10.00 10.00 100.0% 0 274 982

مقارنة سريعة

تبديل زوج المقارنة