التنقل
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Owl Alpha

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-30

المقياس Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium الإصدار: 2026-02-19 Owl Alpha Owl Alpha none الإصدار: 2026-04-30
النتيجة 9.6 6.0
الترتيب #2 #87
الموثوقية غير متاح 10.0
الاتساق 10.0 9.1
اختبارات صحيحة
معدل النجاح لكل محاولة 94.4% 46.3%
اختبارات غير مستقرة 0 2
إجمالي مرات التشغيل 54 54
التكلفة لكل نتيجة 3.400 0.000
إجمالي التكلفة $0.578 $0.000
??? ??????? $2.000 / 1M $0.000 / 1M
??? ??????? $12.000 / 1M $0.000 / 1M
رموز الإخراج 1,932 1,671
رموز الاستدلال 40,542 0
زمن الاستجابة (المتوسط) 15.96s 7.07s
زمن الاستجابة (الحد الأقصى) 40.61s 32.27s
زمن الاستجابة (الإجمالي) 175.52s 127.23s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
Owl Alpha 3.4 7.9 16.7% 1 2.78s 57 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
Owl Alpha 10.0 10.0 100.0% 0 32.27s 450 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
Owl Alpha 3.0 10.0 0.0% 0 21.74s 315 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
Owl Alpha 10.0 10.0 100.0% 0 3.60s 246 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Owl Alpha 5.3 10.0 33.3% 0 3.00s 27 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
Owl Alpha 4.3 10.0 0.0% 0 4.61s 80 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Owl Alpha 6.4 10.0 50.0% 0 2.63s 63 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
Owl Alpha 5.9 7.2 55.6% 1 4.43s 202 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
Owl Alpha 10.0 10.0 100.0% 0 22.78s 231 0

مقارنة سريعة

تبديل زوج المقارنة