التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 2.5 Flash vs inclusionAI: Ring-2.6-1T

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-01

المقياس Gemini 2.5 Flash Gemini 2.5 Flash medium الإصدار: 2025-06-17 Ring-2.6-1T Ring-2.6-1T none الإصدار: 2026-05-10
النتيجة 7.7 7.2
الترتيب #40 #70
الموثوقية 10.0 10.0
الاتساق 9.6 9.1
اختبارات صحيحة
معدل النجاح لكل محاولة 68.3% 62.5%
اختبارات غير مستقرة 1 2
إجمالي مرات التشغيل 60 60
التكلفة لكل نتيجة 2.750 0.000
إجمالي التكلفة $0.358 $0.103
سعر الإدخال $0.300 / 1M $0.300 / 1M
سعر الإخراج $2.500 / 1M $2.500 / 1M
رموز الإخراج 1,924 39,954
رموز الاستدلال 137,255 0
زمن الاستجابة (المتوسط) 15.57s 55.10s
زمن الاستجابة (الحد الأقصى) 95.48s 143.82s
زمن الاستجابة (الإجمالي) 311.47s 881.55s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 2.5 Flash 8.4 10.0 75.0% 0 6.30s 255 10,233
Ring-2.6-1T 9.2 8.4 91.7% 1 43.33s 5,575 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 2.5 Flash 6.6 10.0 50.0% 0 54.56s 537 24,413
Ring-2.6-1T 10.0 10.0 100.0% 0 143.82s 5,036 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 2.5 Flash 10.0 10.0 100.0% 0 28.44s 303 11,922
Ring-2.6-1T 0.0 0.0 0.0% 0 0ms 0 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 2.5 Flash 10.0 10.0 100.0% 0 4.06s 279 2,325
Ring-2.6-1T 3.0 10.0 0.0% 0 45.87s 1,529 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 2.5 Flash 5.9 7.2 55.6% 1 37.34s 18 80,702
Ring-2.6-1T 5.3 7.2 44.4% 1 73.40s 17,728 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 2.5 Flash 4.8 10.0 0.0% 0 4.86s 92 1,899
Ring-2.6-1T 4.3 10.0 0.0% 0 15.63s 846 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 2.5 Flash 9.8 10.0 100.0% 0 2.62s 69 1,203
Ring-2.6-1T 9.8 10.0 100.0% 0 27.36s 2,004 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 2.5 Flash 7.7 10.0 66.7% 0 3.18s 126 2,499
Ring-2.6-1T 7.7 10.0 66.7% 0 31.47s 3,469 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 2.5 Flash 10.0 10.0 100.0% 0 6.20s 234 1,140
Ring-2.6-1T 0.0 0.0 0.0% 0 0ms 0 0
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 2.5 Flash 3.0 10.0 0.0% 0 2.76s 11 919
Ring-2.6-1T 3.0 10.0 0.0% 0 133.60s 3,767 0

مقارنة سريعة

تبديل زوج المقارنة