التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

النماذج المقارنة

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-04

المقياس Google: Gemini 3.1 Flash Lite Preview low الإصدار: 2026-03-03 Google: Gemini 3.1 Flash Lite Preview medium الإصدار: 2026-03-03 Google: Gemini 3.1 Flash Lite Preview high الإصدار: 2026-03-03 Google: Gemini 3 Flash Preview low الإصدار: 2025-12-17
الترتيب #12 #19 #7 #8
متوسط الدرجة 7.38 7.12 7.92 7.87
الاتساق 10.00 10.00 9.99 9.44
التكلفة لكل نتيجة 0.162 0.403 17.455 0.624
إجمالي التكلفة $0.017 $0.037 $1.920 $0.069
اختبارات صحيحة
معدل النجاح لكل محاولة 66.7% 60.0% 73.3% 75.6%
اختبارات غير مستقرة 0 0 0 1
رموز الإخراج 1,392 1,417 943 1,274
رموز الاستدلال 6,379 19,435 1,275,768 18,372

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 7.00 10.00 66.7% 0 456 1,224
Google: Gemini 3.1 Flash Lite Preview 9.00 9.99 66.7% 0 564 3,780
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 144 193,077
Google: Gemini 3 Flash Preview 10.00 10.00 100.0% 0 275 2,476
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 1.00 10.00 0.0% 0 75 253
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 109 2,449
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 112 126,813
Google: Gemini 3 Flash Preview 1.00 10.00 0.0% 0 104 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 9.88 10.00 100.0% 0 291 696
Google: Gemini 3.1 Flash Lite Preview 9.88 10.00 100.0% 0 279 2,952
Google: Gemini 3.1 Flash Lite Preview 9.88 10.00 100.0% 0 279 6,186
Google: Gemini 3 Flash Preview 10.00 10.00 100.0% 0 305 3,004
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 4.00 10.00 33.3% 0 18 1,212
Google: Gemini 3.1 Flash Lite Preview 1.00 10.00 0.0% 0 18 5,325
Google: Gemini 3.1 Flash Lite Preview 4.00 10.00 33.3% 0 18 566,202
Google: Gemini 3 Flash Preview 4.00 7.21 44.4% 1 12 6,410
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 8.50 10.00 50.0% 0 72 753
Google: Gemini 3.1 Flash Lite Preview 8.00 9.99 50.0% 0 72 2,121
Google: Gemini 3.1 Flash Lite Preview 8.00 9.96 50.0% 0 69 190,053
Google: Gemini 3 Flash Preview 7.50 9.99 50.0% 0 71 2,752
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 243 1,248
Google: Gemini 3.1 Flash Lite Preview 7.00 10.00 66.7% 0 141 1,896
Google: Gemini 3.1 Flash Lite Preview 7.00 10.00 66.7% 0 87 190,953
Google: Gemini 3 Flash Preview 10.00 10.00 100.0% 0 273 3,315
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 237 993
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 234 912
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 234 2,484
Google: Gemini 3 Flash Preview 10.00 10.00 100.0% 0 234 415

مقارنة سريعة

تبديل زوج المقارنة