إجمالي الاختبارات: 18الاختبارات الخاطئة: 13الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 33.3%اختبارات غير مستقرة: 2…رموز الإخراج: 4,444رموز الاستدلال: 0زمن الاستجابة: المتوسط 29.39s · الإجمالي 529.10s · الحد الأقصى 111.96s
حيل مضادة للذكاء الاصطناعي
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 4زمن الاستجابة (المتوسط)20.18sزمن الاستجابة (الحد الأقصى)26.54sزمن الاستجابة (الإجمالي)80.73s
البرمجة
: 6.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)24.04sزمن الاستجابة (الحد الأقصى)24.04sزمن الاستجابة (الإجمالي)24.04s
مجمّع
: 4.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.استدعاء أداة غير صالح: 1زمن الاستجابة (المتوسط)111.96sزمن الاستجابة (الحد الأقصى)111.96sزمن الاستجابة (الإجمالي)111.96s
تحليل البيانات واستخراجها
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)23.79sزمن الاستجابة (الحد الأقصى)23.85sزمن الاستجابة (الإجمالي)47.57s
خاص بالمجال
: 5.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2زمن الاستجابة (المتوسط)19.73sزمن الاستجابة (الحد الأقصى)27.66sزمن الاستجابة (الإجمالي)59.18s
الذكاء العام
: 4.2 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)23.74sزمن الاستجابة (الحد الأقصى)23.74sزمن الاستجابة (الإجمالي)23.74s
اتباع التعليمات
: 6.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.تنسيق إضافي: 1زمن الاستجابة (المتوسط)17.54sزمن الاستجابة (الحد الأقصى)18.51sزمن الاستجابة (الإجمالي)35.08s
حل الألغاز
: 3.1 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 2تنسيق إضافي: 1زمن الاستجابة (المتوسط)22.96sزمن الاستجابة (الحد الأقصى)29.24sزمن الاستجابة (الإجمالي)68.87s
استدعاء الأدوات
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)77.93sزمن الاستجابة (الحد الأقصى)77.93sزمن الاستجابة (الإجمالي)77.93s
إجمالي الاختبارات: 18الاختبارات الخاطئة: 14الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 29.6%اختبارات غير مستقرة: 2…رموز الإخراج: 1,591رموز الاستدلال: 0زمن الاستجابة: المتوسط 1.19s · الإجمالي 21.37s · الحد الأقصى 6.48s
حيل مضادة للذكاء الاصطناعي
: 4.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 4زمن الاستجابة (المتوسط)597msزمن الاستجابة (الحد الأقصى)866msزمن الاستجابة (الإجمالي)2.39s
البرمجة
: 5.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)1.14sزمن الاستجابة (الحد الأقصى)1.14sزمن الاستجابة (الإجمالي)1.14s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.استدعاء أداة غير صالح: 1زمن الاستجابة (المتوسط)6.48sزمن الاستجابة (الحد الأقصى)6.48sزمن الاستجابة (الإجمالي)6.48s
تحليل البيانات واستخراجها
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)601msزمن الاستجابة (الحد الأقصى)634msزمن الاستجابة (الإجمالي)1.20s
خاص بالمجال
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)611msزمن الاستجابة (الحد الأقصى)616msزمن الاستجابة (الإجمالي)1.83s
الذكاء العام
: 5.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)541msزمن الاستجابة (الحد الأقصى)541msزمن الاستجابة (الإجمالي)541ms
اتباع التعليمات
: 4.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1إجابة خاطئة: 1زمن الاستجابة (المتوسط)687msزمن الاستجابة (الحد الأقصى)952msزمن الاستجابة (الإجمالي)1.37s
حل الألغاز
: 5.9 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1إجابة خاطئة: 1زمن الاستجابة (المتوسط)541msزمن الاستجابة (الحد الأقصى)677msزمن الاستجابة (الإجمالي)1.62s
استدعاء الأدوات
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)4.79sزمن الاستجابة (الحد الأقصى)4.79sزمن الاستجابة (الإجمالي)4.79s
إجمالي الاختبارات: 18الاختبارات الخاطئة: 14الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 51.9%اختبارات غير مستقرة: 10…رموز الإخراج: 4,984رموز الاستدلال: 62,787زمن الاستجابة: المتوسط 31.08s · الإجمالي 528.37s · الحد الأقصى 117.04s
البرمجة
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)91.27sزمن الاستجابة (الحد الأقصى)91.27sزمن الاستجابة (الإجمالي)91.27s
مجمّع
: 4.7 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.استدعاء أداة غير صالح: 1زمن الاستجابة (المتوسط)41.03sزمن الاستجابة (الحد الأقصى)41.03sزمن الاستجابة (الإجمالي)41.03s
تحليل البيانات واستخراجها
: 6.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)21.95sزمن الاستجابة (الحد الأقصى)24.88sزمن الاستجابة (الإجمالي)43.89s
خاص بالمجال
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.انتهت المهلة: 2إجابة خاطئة: 1زمن الاستجابة (المتوسط)19.00sزمن الاستجابة (الحد الأقصى)21.63sزمن الاستجابة (الإجمالي)38.01s
الذكاء العام
: 3.9 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)38.70sزمن الاستجابة (الحد الأقصى)38.70sزمن الاستجابة (الإجمالي)38.70s
اتباع التعليمات
: 3.7 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1إجابة خاطئة: 1زمن الاستجابة (المتوسط)12.64sزمن الاستجابة (الحد الأقصى)15.23sزمن الاستجابة (الإجمالي)25.28s
حل الألغاز
: 3.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 2إجابة خاطئة: 1زمن الاستجابة (المتوسط)25.62sزمن الاستجابة (الحد الأقصى)46.29sزمن الاستجابة (الإجمالي)76.87s
استدعاء الأدوات
: 4.7 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)12.05sزمن الاستجابة (الحد الأقصى)12.05sزمن الاستجابة (الإجمالي)12.05s
إجمالي الاختبارات: 18الاختبارات الخاطئة: 13الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 29.6%اختبارات غير مستقرة: 1…رموز الإخراج: 2,596رموز الاستدلال: 0زمن الاستجابة: المتوسط 1.27s · الإجمالي 22.82s · الحد الأقصى 3.70s
حيل مضادة للذكاء الاصطناعي
: 6.6 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2زمن الاستجابة (المتوسط)1.19sزمن الاستجابة (الحد الأقصى)2.04sزمن الاستجابة (الإجمالي)4.75s
البرمجة
: 5.1 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)1.30sزمن الاستجابة (الحد الأقصى)1.30sزمن الاستجابة (الإجمالي)1.30s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)3.70sزمن الاستجابة (الحد الأقصى)3.70sزمن الاستجابة (الإجمالي)3.70s
تحليل البيانات واستخراجها
: 6.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)979msزمن الاستجابة (الحد الأقصى)1.02sزمن الاستجابة (الإجمالي)1.96s
خاص بالمجال
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)925msزمن الاستجابة (الحد الأقصى)1.16sزمن الاستجابة (الإجمالي)2.77s
الذكاء العام
: 4.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)920msزمن الاستجابة (الحد الأقصى)920msزمن الاستجابة (الإجمالي)920ms
اتباع التعليمات
: 9.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)987msزمن الاستجابة (الحد الأقصى)1.13sزمن الاستجابة (الإجمالي)1.97s
حل الألغاز
: 3.7 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 2إجابة خاطئة: 1زمن الاستجابة (المتوسط)867msزمن الاستجابة (الحد الأقصى)972msزمن الاستجابة (الإجمالي)2.60s
استدعاء الأدوات
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.استدعاء أداة غير صالح: 1زمن الاستجابة (المتوسط)2.83sزمن الاستجابة (الحد الأقصى)2.83sزمن الاستجابة (الإجمالي)2.83s
إجمالي الاختبارات: 18الاختبارات الخاطئة: 13الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 29.6%اختبارات غير مستقرة: 1…رموز الإخراج: 1,967رموز الاستدلال: 0زمن الاستجابة: المتوسط 1.11s · الإجمالي 20.02s · الحد الأقصى 6.04s
حيل مضادة للذكاء الاصطناعي
: 4.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)501msزمن الاستجابة (الحد الأقصى)839msزمن الاستجابة (الإجمالي)2.01s
البرمجة
: 3.4 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)1.22sزمن الاستجابة (الحد الأقصى)1.22sزمن الاستجابة (الإجمالي)1.22s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.استدعاء أداة غير صالح: 1زمن الاستجابة (المتوسط)6.04sزمن الاستجابة (الحد الأقصى)6.04sزمن الاستجابة (الإجمالي)6.04s
تحليل البيانات واستخراجها
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)522msزمن الاستجابة (الحد الأقصى)537msزمن الاستجابة (الإجمالي)1.04s
خاص بالمجال
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2تنسيق إضافي: 1زمن الاستجابة (المتوسط)687msزمن الاستجابة (الحد الأقصى)821msزمن الاستجابة (الإجمالي)2.06s
الذكاء العام
: 4.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)659msزمن الاستجابة (الحد الأقصى)659msزمن الاستجابة (الإجمالي)659ms
اتباع التعليمات
: 4.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1إجابة خاطئة: 1زمن الاستجابة (المتوسط)455msزمن الاستجابة (الحد الأقصى)505msزمن الاستجابة (الإجمالي)910ms
حل الألغاز
: 5.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1إجابة خاطئة: 1زمن الاستجابة (المتوسط)487msزمن الاستجابة (الحد الأقصى)539msزمن الاستجابة (الإجمالي)1.46s
استدعاء الأدوات
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)4.63sزمن الاستجابة (الحد الأقصى)4.63sزمن الاستجابة (الإجمالي)4.63s
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 11لم يتبع التعليمات: 2زمن الاستجابة (المتوسط)665msزمن الاستجابة (الحد الأقصى)1.72sزمن الاستجابة (الإجمالي)11.97s…
إجمالي الاختبارات: 18الاختبارات الخاطئة: 13الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 31.5%اختبارات غير مستقرة: 1…رموز الإخراج: 2,207رموز الاستدلال: 0زمن الاستجابة: المتوسط 665ms · الإجمالي 11.97s · الحد الأقصى 1.72s
حيل مضادة للذكاء الاصطناعي
: 3.4 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 4زمن الاستجابة (المتوسط)395msزمن الاستجابة (الحد الأقصى)769msزمن الاستجابة (الإجمالي)1.58s
البرمجة
: 4.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)1.28sزمن الاستجابة (الحد الأقصى)1.28sزمن الاستجابة (الإجمالي)1.28s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)1.72sزمن الاستجابة (الحد الأقصى)1.72sزمن الاستجابة (الإجمالي)1.72s
تحليل البيانات واستخراجها
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)822msزمن الاستجابة (الحد الأقصى)1.08sزمن الاستجابة (الإجمالي)1.64s
خاص بالمجال
: 5.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2زمن الاستجابة (المتوسط)367msزمن الاستجابة (الحد الأقصى)388msزمن الاستجابة (الإجمالي)1.10s
الذكاء العام
: 4.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)729msزمن الاستجابة (الحد الأقصى)729msزمن الاستجابة (الإجمالي)729ms
اتباع التعليمات
: 6.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)380msزمن الاستجابة (الحد الأقصى)380msزمن الاستجابة (الإجمالي)759ms
حل الألغاز
: 3.1 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 2إجابة خاطئة: 1زمن الاستجابة (المتوسط)589msزمن الاستجابة (الحد الأقصى)853msزمن الاستجابة (الإجمالي)1.77s
استدعاء الأدوات
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)1.40sزمن الاستجابة (الحد الأقصى)1.40sزمن الاستجابة (الإجمالي)1.40s
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 6لم يتبع التعليمات: 5خطأ API: 3زمن الاستجابة (المتوسط)11.96sزمن الاستجابة (الحد الأقصى)68.97sزمن الاستجابة (الإجمالي)179.34s…
إجمالي الاختبارات: 18الاختبارات الخاطئة: 14الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 38.9%اختبارات غير مستقرة: 5…رموز الإخراج: 44,652رموز الاستدلال: 0زمن الاستجابة: المتوسط 11.96s · الإجمالي 179.34s · الحد الأقصى 68.97s
البرمجة
: 4.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)9.57sزمن الاستجابة (الحد الأقصى)9.57sزمن الاستجابة (الإجمالي)9.57s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1زمن الاستجابة (المتوسط)0msزمن الاستجابة (الحد الأقصى)0msزمن الاستجابة (الإجمالي)0ms
تحليل البيانات واستخراجها
: 6.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1زمن الاستجابة (المتوسط)7.12sزمن الاستجابة (الحد الأقصى)7.12sزمن الاستجابة (الإجمالي)7.12s
خاص بالمجال
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)34.98sزمن الاستجابة (الحد الأقصى)68.97sزمن الاستجابة (الإجمالي)104.94s
الذكاء العام
: 4.6 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)2.83sزمن الاستجابة (الحد الأقصى)2.83sزمن الاستجابة (الإجمالي)2.83s
اتباع التعليمات
: 8.4 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)5.10sزمن الاستجابة (الحد الأقصى)5.85sزمن الاستجابة (الإجمالي)10.21s
حل الألغاز
: 4.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 2إجابة خاطئة: 1زمن الاستجابة (المتوسط)6.86sزمن الاستجابة (الحد الأقصى)10.66sزمن الاستجابة (الإجمالي)20.59s
استدعاء الأدوات
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1زمن الاستجابة (المتوسط)0msزمن الاستجابة (الحد الأقصى)0msزمن الاستجابة (الإجمالي)0ms
إجمالي الاختبارات: 18الاختبارات الخاطئة: 13الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 31.5%اختبارات غير مستقرة: 1…رموز الإخراج: 2,573رموز الاستدلال: 0زمن الاستجابة: المتوسط 1.23s · الإجمالي 22.16s · الحد الأقصى 3.81s
البرمجة
: 6.4 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)1.39sزمن الاستجابة (الحد الأقصى)1.39sزمن الاستجابة (الإجمالي)1.39s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)3.81sزمن الاستجابة (الحد الأقصى)3.81sزمن الاستجابة (الإجمالي)3.81s
تحليل البيانات واستخراجها
: 6.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)1.04sزمن الاستجابة (الحد الأقصى)1.05sزمن الاستجابة (الإجمالي)2.08s
خاص بالمجال
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)927msزمن الاستجابة (الحد الأقصى)1.17sزمن الاستجابة (الإجمالي)2.78s
الذكاء العام
: 4.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)854msزمن الاستجابة (الحد الأقصى)854msزمن الاستجابة (الإجمالي)854ms
اتباع التعليمات
: 9.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)1.03sزمن الاستجابة (الحد الأقصى)1.17sزمن الاستجابة (الإجمالي)2.07s
حل الألغاز
: 3.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)849msزمن الاستجابة (الحد الأقصى)925msزمن الاستجابة (الإجمالي)2.55s
استدعاء الأدوات
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.استدعاء أداة غير صالح: 1زمن الاستجابة (المتوسط)2.79sزمن الاستجابة (الحد الأقصى)2.79sزمن الاستجابة (الإجمالي)2.79s
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 10لم يتبع التعليمات: 3زمن الاستجابة (المتوسط)1.17sزمن الاستجابة (الحد الأقصى)2.52sزمن الاستجابة (الإجمالي)21.01s…
إجمالي الاختبارات: 18الاختبارات الخاطئة: 13الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 35.2%اختبارات غير مستقرة: 3…رموز الإخراج: 2,418رموز الاستدلال: 0زمن الاستجابة: المتوسط 1.17s · الإجمالي 21.01s · الحد الأقصى 2.52s
حيل مضادة للذكاء الاصطناعي
: 3.1 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 4زمن الاستجابة (المتوسط)929msزمن الاستجابة (الحد الأقصى)1.55sزمن الاستجابة (الإجمالي)3.72s
البرمجة
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)1.19sزمن الاستجابة (الحد الأقصى)1.19sزمن الاستجابة (الإجمالي)1.19s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)2.52sزمن الاستجابة (الحد الأقصى)2.52sزمن الاستجابة (الإجمالي)2.52s
تحليل البيانات واستخراجها
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)1.30sزمن الاستجابة (الحد الأقصى)1.58sزمن الاستجابة (الإجمالي)2.61s
خاص بالمجال
: 3.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)937msزمن الاستجابة (الحد الأقصى)1.25sزمن الاستجابة (الإجمالي)2.81s
الذكاء العام
: 4.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)1.82sزمن الاستجابة (الحد الأقصى)1.82sزمن الاستجابة (الإجمالي)1.82s
اتباع التعليمات
: 6.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)728msزمن الاستجابة (الحد الأقصى)731msزمن الاستجابة (الإجمالي)1.46s
حل الألغاز
: 5.4 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1إجابة خاطئة: 1زمن الاستجابة (المتوسط)860msزمن الاستجابة (الحد الأقصى)958msزمن الاستجابة (الإجمالي)2.58s
استدعاء الأدوات
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)2.32sزمن الاستجابة (الحد الأقصى)2.32sزمن الاستجابة (الإجمالي)2.32s
إجمالي الاختبارات: 18الاختبارات الخاطئة: 14الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 25.9%اختبارات غير مستقرة: 1…رموز الإخراج: 3,617رموز الاستدلال: 0زمن الاستجابة: المتوسط 10.18s · الإجمالي 122.13s · الحد الأقصى 45.14s
البرمجة
: 7.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)3.14sزمن الاستجابة (الحد الأقصى)3.14sزمن الاستجابة (الإجمالي)3.14s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)45.14sزمن الاستجابة (الحد الأقصى)45.14sزمن الاستجابة (الإجمالي)45.14s
تحليل البيانات واستخراجها
: 6.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)1.32sزمن الاستجابة (الحد الأقصى)1.32sزمن الاستجابة (الإجمالي)1.32s
خاص بالمجال
: 5.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2زمن الاستجابة (المتوسط)962msزمن الاستجابة (الحد الأقصى)962msزمن الاستجابة (الإجمالي)962ms
الذكاء العام
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)1.34sزمن الاستجابة (الحد الأقصى)1.34sزمن الاستجابة (الإجمالي)1.34s
اتباع التعليمات
: 4.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2زمن الاستجابة (المتوسط)7.71sزمن الاستجابة (الحد الأقصى)14.65sزمن الاستجابة (الإجمالي)15.42s
حل الألغاز
: 3.2 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)22.86sزمن الاستجابة (الحد الأقصى)42.58sزمن الاستجابة (الإجمالي)45.73s
استدعاء الأدوات
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)2.47sزمن الاستجابة (الحد الأقصى)2.47sزمن الاستجابة (الإجمالي)2.47s
إجمالي الاختبارات: 18الاختبارات الخاطئة: 13الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 27.8%اختبارات غير مستقرة: 0…رموز الإخراج: 2,177رموز الاستدلال: 0زمن الاستجابة: المتوسط 1.05s · الإجمالي 18.94s · الحد الأقصى 2.43s
حيل مضادة للذكاء الاصطناعي
: 4.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)842msزمن الاستجابة (الحد الأقصى)1.47sزمن الاستجابة (الإجمالي)3.37s
البرمجة
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)1.95sزمن الاستجابة (الحد الأقصى)1.95sزمن الاستجابة (الإجمالي)1.95s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)2.36sزمن الاستجابة (الحد الأقصى)2.36sزمن الاستجابة (الإجمالي)2.36s
تحليل البيانات واستخراجها
: 6.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.تنسيق إضافي: 1زمن الاستجابة (المتوسط)1.01sزمن الاستجابة (الحد الأقصى)1.18sزمن الاستجابة (الإجمالي)2.03s
خاص بالمجال
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)756msزمن الاستجابة (الحد الأقصى)877msزمن الاستجابة (الإجمالي)2.27s
الذكاء العام
: 4.6 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)841msزمن الاستجابة (الحد الأقصى)841msزمن الاستجابة (الإجمالي)841ms
اتباع التعليمات
: 6.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)751msزمن الاستجابة (الحد الأقصى)821msزمن الاستجابة (الإجمالي)1.50s
حل الألغاز
: 3.4 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 2إجابة خاطئة: 1زمن الاستجابة (المتوسط)731msزمن الاستجابة (الحد الأقصى)958msزمن الاستجابة (الإجمالي)2.19s
استدعاء الأدوات
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)2.43sزمن الاستجابة (الحد الأقصى)2.43sزمن الاستجابة (الإجمالي)2.43s
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 10لم يتبع التعليمات: 4زمن الاستجابة (المتوسط)8.54sزمن الاستجابة (الحد الأقصى)24.97sزمن الاستجابة (الإجمالي)153.69s…
إجمالي الاختبارات: 18الاختبارات الخاطئة: 14الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 35.2%اختبارات غير مستقرة: 4…رموز الإخراج: 4,760رموز الاستدلال: 0زمن الاستجابة: المتوسط 8.54s · الإجمالي 153.69s · الحد الأقصى 24.97s
حيل مضادة للذكاء الاصطناعي
: 4.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)7.43sزمن الاستجابة (الحد الأقصى)16.69sزمن الاستجابة (الإجمالي)29.72s
البرمجة
: 3.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)2.99sزمن الاستجابة (الحد الأقصى)2.99sزمن الاستجابة (الإجمالي)2.99s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)19.98sزمن الاستجابة (الحد الأقصى)19.98sزمن الاستجابة (الإجمالي)19.98s
تحليل البيانات واستخراجها
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)7.92sزمن الاستجابة (الحد الأقصى)13.23sزمن الاستجابة (الإجمالي)15.84s
خاص بالمجال
: 3.6 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)6.23sزمن الاستجابة (الحد الأقصى)14.38sزمن الاستجابة (الإجمالي)18.70s
الذكاء العام
: 4.2 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)24.97sزمن الاستجابة (الحد الأقصى)24.97sزمن الاستجابة (الإجمالي)24.97s
اتباع التعليمات
: 4.9 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1إجابة خاطئة: 1زمن الاستجابة (المتوسط)1.50sزمن الاستجابة (الحد الأقصى)2.07sزمن الاستجابة (الإجمالي)2.99s
حل الألغاز
: 5.7 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1إجابة خاطئة: 1زمن الاستجابة (المتوسط)7.50sزمن الاستجابة (الحد الأقصى)15.00sزمن الاستجابة (الإجمالي)22.50s
استدعاء الأدوات
: 4.7 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)16.00sزمن الاستجابة (الحد الأقصى)16.00sزمن الاستجابة (الإجمالي)16.00s
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 13لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)2.00sزمن الاستجابة (الحد الأقصى)7.58sزمن الاستجابة (الإجمالي)21.99s…
إجمالي الاختبارات: 18الاختبارات الخاطئة: 14الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 22.2%اختبارات غير مستقرة: 0…رموز الإخراج: 1,947رموز الاستدلال: 0زمن الاستجابة: المتوسط 2.00s · الإجمالي 21.99s · الحد الأقصى 7.58s
حيل مضادة للذكاء الاصطناعي
: 4.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)1.34sزمن الاستجابة (الحد الأقصى)1.83sزمن الاستجابة (الإجمالي)2.67s
البرمجة
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)2.55sزمن الاستجابة (الحد الأقصى)2.55sزمن الاستجابة (الإجمالي)2.55s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)7.58sزمن الاستجابة (الحد الأقصى)7.58sزمن الاستجابة (الإجمالي)7.58s
تحليل البيانات واستخراجها
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)1.27sزمن الاستجابة (الحد الأقصى)1.27sزمن الاستجابة (الإجمالي)1.27s
خاص بالمجال
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)637msزمن الاستجابة (الحد الأقصى)637msزمن الاستجابة (الإجمالي)637ms
الذكاء العام
: 4.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)909msزمن الاستجابة (الحد الأقصى)909msزمن الاستجابة (الإجمالي)909ms
اتباع التعليمات
: 4.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1إجابة خاطئة: 1زمن الاستجابة (المتوسط)1.27sزمن الاستجابة (الحد الأقصى)1.27sزمن الاستجابة (الإجمالي)1.27s
حل الألغاز
: 3.7 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)1.30sزمن الاستجابة (الحد الأقصى)1.54sزمن الاستجابة (الإجمالي)2.60s
استدعاء الأدوات
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)2.51sزمن الاستجابة (الحد الأقصى)2.51sزمن الاستجابة (الإجمالي)2.51s
إجمالي الاختبارات: 18الاختبارات الخاطئة: 14الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 24.1%اختبارات غير مستقرة: 1…رموز الإخراج: 3,951رموز الاستدلال: 0زمن الاستجابة: المتوسط 1.47s · الإجمالي 26.43s · الحد الأقصى 5.91s
حيل مضادة للذكاء الاصطناعي
: 3.1 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 4زمن الاستجابة (المتوسط)1.71sزمن الاستجابة (الحد الأقصى)3.79sزمن الاستجابة (الإجمالي)6.84s
البرمجة
: 5.2 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)5.69sزمن الاستجابة (الحد الأقصى)5.69sزمن الاستجابة (الإجمالي)5.69s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.استدعاء أداة غير صالح: 1زمن الاستجابة (المتوسط)5.91sزمن الاستجابة (الحد الأقصى)5.91sزمن الاستجابة (الإجمالي)5.91s
تحليل البيانات واستخراجها
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)847msزمن الاستجابة (الحد الأقصى)1.09sزمن الاستجابة (الإجمالي)1.69s
خاص بالمجال
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)464msزمن الاستجابة (الحد الأقصى)622msزمن الاستجابة (الإجمالي)1.39s
الذكاء العام
: 4.4 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)552msزمن الاستجابة (الحد الأقصى)552msزمن الاستجابة (الإجمالي)552ms
اتباع التعليمات
: 6.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)514msزمن الاستجابة (الحد الأقصى)582msزمن الاستجابة (الإجمالي)1.03s
حل الألغاز
: 3.2 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 2إجابة خاطئة: 1زمن الاستجابة (المتوسط)683msزمن الاستجابة (الحد الأقصى)945msزمن الاستجابة (الإجمالي)2.05s
استدعاء الأدوات
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)1.27sزمن الاستجابة (الحد الأقصى)1.27sزمن الاستجابة (الإجمالي)1.27s
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 13لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)613msزمن الاستجابة (الحد الأقصى)1.27sزمن الاستجابة (الإجمالي)11.04s…
إجمالي الاختبارات: 18الاختبارات الخاطئة: 14الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 27.8%اختبارات غير مستقرة: 2…رموز الإخراج: 1,625رموز الاستدلال: 0زمن الاستجابة: المتوسط 613ms · الإجمالي 11.04s · الحد الأقصى 1.27s
حيل مضادة للذكاء الاصطناعي
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 4زمن الاستجابة (المتوسط)483msزمن الاستجابة (الحد الأقصى)716msزمن الاستجابة (الإجمالي)1.93s
البرمجة
: 3.6 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)969msزمن الاستجابة (الحد الأقصى)969msزمن الاستجابة (الإجمالي)969ms
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)606msزمن الاستجابة (الحد الأقصى)606msزمن الاستجابة (الإجمالي)606ms
تحليل البيانات واستخراجها
: 7.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)667msزمن الاستجابة (الحد الأقصى)819msزمن الاستجابة (الإجمالي)1.33s
خاص بالمجال
: 5.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2زمن الاستجابة (المتوسط)534msزمن الاستجابة (الحد الأقصى)733msزمن الاستجابة (الإجمالي)1.60s
الذكاء العام
: 4.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)628msزمن الاستجابة (الحد الأقصى)628msزمن الاستجابة (الإجمالي)628ms
اتباع التعليمات
: 6.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)551msزمن الاستجابة (الحد الأقصى)622msزمن الاستجابة (الإجمالي)1.10s
حل الألغاز
: 3.1 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)533msزمن الاستجابة (الحد الأقصى)637msزمن الاستجابة (الإجمالي)1.60s
استدعاء الأدوات
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)1.27sزمن الاستجابة (الحد الأقصى)1.27sزمن الاستجابة (الإجمالي)1.27s
إجمالي الاختبارات: 18الاختبارات الخاطئة: 15الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 27.8%اختبارات غير مستقرة: 3…رموز الإخراج: 3,241رموز الاستدلال: 0زمن الاستجابة: المتوسط 10.75s · الإجمالي 129.01s · الحد الأقصى 81.80s
البرمجة
: 4.7 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.انتهت المهلة: 1زمن الاستجابة (المتوسط)1.69sزمن الاستجابة (الحد الأقصى)1.69sزمن الاستجابة (الإجمالي)1.69s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)4.28sزمن الاستجابة (الحد الأقصى)4.28sزمن الاستجابة (الإجمالي)4.28s
تحليل البيانات واستخراجها
: 6.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)81.80sزمن الاستجابة (الحد الأقصى)81.80sزمن الاستجابة (الإجمالي)81.80s
خاص بالمجال
: 5.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2زمن الاستجابة (المتوسط)638msزمن الاستجابة (الحد الأقصى)638msزمن الاستجابة (الإجمالي)638ms
الذكاء العام
: 6.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)1.39sزمن الاستجابة (الحد الأقصى)1.39sزمن الاستجابة (الإجمالي)1.39s
اتباع التعليمات
: 4.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1إجابة خاطئة: 1زمن الاستجابة (المتوسط)7.34sزمن الاستجابة (الحد الأقصى)13.67sزمن الاستجابة (الإجمالي)14.68s
حل الألغاز
: 3.1 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 2إجابة خاطئة: 1زمن الاستجابة (المتوسط)2.30sزمن الاستجابة (الحد الأقصى)3.80sزمن الاستجابة (الإجمالي)4.61s
استدعاء الأدوات
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)2.64sزمن الاستجابة (الحد الأقصى)2.64sزمن الاستجابة (الإجمالي)2.64s
إجمالي الاختبارات: 18الاختبارات الخاطئة: 14الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 27.8%اختبارات غير مستقرة: 2…رموز الإخراج: 2,639رموز الاستدلال: 0زمن الاستجابة: المتوسط 13.56s · الإجمالي 230.55s · الحد الأقصى 35.84s
البرمجة
: 2.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)4.56sزمن الاستجابة (الحد الأقصى)4.56sزمن الاستجابة (الإجمالي)4.56s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)35.84sزمن الاستجابة (الحد الأقصى)35.84sزمن الاستجابة (الإجمالي)35.84s
تحليل البيانات واستخراجها
: 6.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1زمن الاستجابة (المتوسط)2.85sزمن الاستجابة (الحد الأقصى)2.85sزمن الاستجابة (الإجمالي)2.85s
خاص بالمجال
: 3.6 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2خطأ API: 1زمن الاستجابة (المتوسط)17.61sزمن الاستجابة (الحد الأقصى)25.68sزمن الاستجابة (الإجمالي)52.82s
الذكاء العام
: 4.1 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)16.07sزمن الاستجابة (الحد الأقصى)16.07sزمن الاستجابة (الإجمالي)16.07s
اتباع التعليمات
: 6.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.تنسيق إضافي: 1زمن الاستجابة (المتوسط)12.98sزمن الاستجابة (الحد الأقصى)23.51sزمن الاستجابة (الإجمالي)25.95s
حل الألغاز
: 3.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)4.76sزمن الاستجابة (الحد الأقصى)7.35sزمن الاستجابة (الإجمالي)14.29s
استدعاء الأدوات
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)33.76sزمن الاستجابة (الحد الأقصى)33.76sزمن الاستجابة (الإجمالي)33.76s
إجمالي الاختبارات: 18الاختبارات الخاطئة: 14الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 38.9%اختبارات غير مستقرة: 8…رموز الإخراج: 39,688رموز الاستدلال: 72,401زمن الاستجابة: المتوسط 32.33s · الإجمالي 355.65s · الحد الأقصى 174.55s
البرمجة
: 3.6 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.انتهت المهلة: 1زمن الاستجابة (المتوسط)21.26sزمن الاستجابة (الحد الأقصى)21.26sزمن الاستجابة (الإجمالي)21.26s
مجمّع
: 2.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.استدعاء أداة غير صالح: 1زمن الاستجابة (المتوسط)65.57sزمن الاستجابة (الحد الأقصى)65.57sزمن الاستجابة (الإجمالي)65.57s
تحليل البيانات واستخراجها
: 6.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابة: 1زمن الاستجابة (المتوسط)1.51sزمن الاستجابة (الحد الأقصى)1.51sزمن الاستجابة (الإجمالي)1.51s
خاص بالمجال
: 3.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2لا توجد إجابة: 1زمن الاستجابة (المتوسط)174.55sزمن الاستجابة (الحد الأقصى)174.55sزمن الاستجابة (الإجمالي)174.55s
الذكاء العام
: 3.6 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)18.14sزمن الاستجابة (الحد الأقصى)18.14sزمن الاستجابة (الإجمالي)18.14s
اتباع التعليمات
: 6.2 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)2.97sزمن الاستجابة (الحد الأقصى)2.97sزمن الاستجابة (الإجمالي)2.97s
حل الألغاز
: 2.9 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)12.90sزمن الاستجابة (الحد الأقصى)22.33sزمن الاستجابة (الإجمالي)25.80s
استدعاء الأدوات
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)15.95sزمن الاستجابة (الحد الأقصى)15.95sزمن الاستجابة (الإجمالي)15.95s
إجمالي الاختبارات: 18الاختبارات الخاطئة: 15الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 27.8%اختبارات غير مستقرة: 5…رموز الإخراج: 68,522رموز الاستدلال: 0زمن الاستجابة: المتوسط 2.79s · الإجمالي 39.08s · الحد الأقصى 19.68s
حيل مضادة للذكاء الاصطناعي
: 3.2 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 4زمن الاستجابة (المتوسط)1.19sزمن الاستجابة (الحد الأقصى)2.73sزمن الاستجابة (الإجمالي)4.76s
البرمجة
: 6.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)2.79sزمن الاستجابة (الحد الأقصى)2.79sزمن الاستجابة (الإجمالي)2.79s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)2.87sزمن الاستجابة (الحد الأقصى)2.87sزمن الاستجابة (الإجمالي)2.87s
تحليل البيانات واستخراجها
: 2.9 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1تنسيق إضافي: 1زمن الاستجابة (المتوسط)19.68sزمن الاستجابة (الحد الأقصى)19.68sزمن الاستجابة (الإجمالي)19.68s
خاص بالمجال
: 5.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2زمن الاستجابة (المتوسط)564msزمن الاستجابة (الحد الأقصى)564msزمن الاستجابة (الإجمالي)564ms
الذكاء العام
: 4.6 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)1.67sزمن الاستجابة (الحد الأقصى)1.67sزمن الاستجابة (الإجمالي)1.67s
اتباع التعليمات
: 6.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)857msزمن الاستجابة (الحد الأقصى)955msزمن الاستجابة (الإجمالي)1.71s
حل الألغاز
: 3.6 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)1.38sزمن الاستجابة (الحد الأقصى)1.74sزمن الاستجابة (الإجمالي)2.75s
استدعاء الأدوات
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)2.28sزمن الاستجابة (الحد الأقصى)2.28sزمن الاستجابة (الإجمالي)2.28s
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 13لم يتبع التعليمات: 2زمن الاستجابة (المتوسط)1.76sزمن الاستجابة (الحد الأقصى)5.51sزمن الاستجابة (الإجمالي)19.35s…
إجمالي الاختبارات: 18الاختبارات الخاطئة: 15الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 24.1%اختبارات غير مستقرة: 3…رموز الإخراج: 1,721رموز الاستدلال: 0زمن الاستجابة: المتوسط 1.76s · الإجمالي 19.35s · الحد الأقصى 5.51s
البرمجة
: 5.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)1.79sزمن الاستجابة (الحد الأقصى)1.79sزمن الاستجابة (الإجمالي)1.79s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)3.33sزمن الاستجابة (الحد الأقصى)3.33sزمن الاستجابة (الإجمالي)3.33s
تحليل البيانات واستخراجها
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)943msزمن الاستجابة (الحد الأقصى)943msزمن الاستجابة (الإجمالي)943ms
خاص بالمجال
: 5.9 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2زمن الاستجابة (المتوسط)1.06sزمن الاستجابة (الحد الأقصى)1.06sزمن الاستجابة (الإجمالي)1.06s
الذكاء العام
: 4.4 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)1.08sزمن الاستجابة (الحد الأقصى)1.08sزمن الاستجابة (الإجمالي)1.08s
اتباع التعليمات
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2زمن الاستجابة (المتوسط)923msزمن الاستجابة (الحد الأقصى)923msزمن الاستجابة (الإجمالي)923ms
حل الألغاز
: 3.2 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)1.28sزمن الاستجابة (الحد الأقصى)1.36sزمن الاستجابة (الإجمالي)2.56s
استدعاء الأدوات
: 2.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)5.51sزمن الاستجابة (الحد الأقصى)5.51sزمن الاستجابة (الإجمالي)5.51s
إجمالي الاختبارات: 18الاختبارات الخاطئة: 15الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 16.7%اختبارات غير مستقرة: 0…رموز الإخراج: 2,434رموز الاستدلال: 0زمن الاستجابة: المتوسط 8.79s · الإجمالي 158.19s · الحد الأقصى 25.72s
حيل مضادة للذكاء الاصطناعي
: 3.4 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 4زمن الاستجابة (المتوسط)6.55sزمن الاستجابة (الحد الأقصى)9.41sزمن الاستجابة (الإجمالي)26.19s
البرمجة
: 5.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)10.57sزمن الاستجابة (الحد الأقصى)10.57sزمن الاستجابة (الإجمالي)10.57s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)23.53sزمن الاستجابة (الحد الأقصى)23.53sزمن الاستجابة (الإجمالي)23.53s
تحليل البيانات واستخراجها
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)1.37sزمن الاستجابة (الحد الأقصى)1.37sزمن الاستجابة (الإجمالي)2.73s
خاص بالمجال
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)1.04sزمن الاستجابة (الحد الأقصى)1.08sزمن الاستجابة (الإجمالي)3.11s
الذكاء العام
: 5.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)20.34sزمن الاستجابة (الحد الأقصى)20.34sزمن الاستجابة (الإجمالي)20.34s
اتباع التعليمات
: 6.4 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)5.36sزمن الاستجابة (الحد الأقصى)9.81sزمن الاستجابة (الإجمالي)10.73s
حل الألغاز
: 3.1 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 2إجابة خاطئة: 1زمن الاستجابة (المتوسط)11.76sزمن الاستجابة (الحد الأقصى)20.15sزمن الاستجابة (الإجمالي)35.28s
استدعاء الأدوات
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.استدعاء أداة غير صالح: 1زمن الاستجابة (المتوسط)25.72sزمن الاستجابة (الحد الأقصى)25.72sزمن الاستجابة (الإجمالي)25.72s
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 13لم يتبع التعليمات: 3زمن الاستجابة (المتوسط)1.40sزمن الاستجابة (الحد الأقصى)3.84sزمن الاستجابة (الإجمالي)25.14s…
إجمالي الاختبارات: 18الاختبارات الخاطئة: 16الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 31.5%اختبارات غير مستقرة: 7…رموز الإخراج: 2,762رموز الاستدلال: 0زمن الاستجابة: المتوسط 1.40s · الإجمالي 25.14s · الحد الأقصى 3.84s
حيل مضادة للذكاء الاصطناعي
: 3.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 4زمن الاستجابة (المتوسط)1.18sزمن الاستجابة (الحد الأقصى)1.81sزمن الاستجابة (الإجمالي)4.70s
البرمجة
: 7.1 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)1.43sزمن الاستجابة (الحد الأقصى)1.43sزمن الاستجابة (الإجمالي)1.43s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)3.84sزمن الاستجابة (الحد الأقصى)3.84sزمن الاستجابة (الإجمالي)3.84s
تحليل البيانات واستخراجها
: 6.5 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)1.11sزمن الاستجابة (الحد الأقصى)1.25sزمن الاستجابة (الإجمالي)2.23s
خاص بالمجال
: 2.9 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)926msزمن الاستجابة (الحد الأقصى)959msزمن الاستجابة (الإجمالي)2.78s
الذكاء العام
: 3.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)1.31sزمن الاستجابة (الحد الأقصى)1.31sزمن الاستجابة (الإجمالي)1.31s
اتباع التعليمات
: 5.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1إجابة خاطئة: 1زمن الاستجابة (المتوسط)787msزمن الاستجابة (الحد الأقصى)865msزمن الاستجابة (الإجمالي)1.57s
حل الألغاز
: 3.7 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)1.29sزمن الاستجابة (الحد الأقصى)1.64sزمن الاستجابة (الإجمالي)3.86s
استدعاء الأدوات
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)3.40sزمن الاستجابة (الحد الأقصى)3.40sزمن الاستجابة (الإجمالي)3.40s
إجمالي الاختبارات: 18الاختبارات الخاطئة: 15الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 33.3%اختبارات غير مستقرة: 6…رموز الإخراج: 24,291رموز الاستدلال: 172,597زمن الاستجابة: المتوسط 73.64s · الإجمالي 1104.60s · الحد الأقصى 226.38s
البرمجة
: 2.6 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)135.61sزمن الاستجابة (الحد الأقصى)135.61sزمن الاستجابة (الإجمالي)135.61s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.انتهت المهلة: 1زمن الاستجابة (المتوسط)0msزمن الاستجابة (الحد الأقصى)0msزمن الاستجابة (الإجمالي)0ms
خاص بالمجال
: 3.6 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.انتهت المهلة: 3زمن الاستجابة (المتوسط)137.75sزمن الاستجابة (الحد الأقصى)202.61sزمن الاستجابة (الإجمالي)413.24s
الذكاء العام
: 2.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.انتهت المهلة: 1زمن الاستجابة (المتوسط)226.38sزمن الاستجابة (الحد الأقصى)226.38sزمن الاستجابة (الإجمالي)226.38s
اتباع التعليمات
: 6.4 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.انتهت المهلة: 1زمن الاستجابة (المتوسط)17.15sزمن الاستجابة (الحد الأقصى)28.54sزمن الاستجابة (الإجمالي)34.29s
حل الألغاز
: 3.1 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.انتهت المهلة: 2لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)33.38sزمن الاستجابة (الحد الأقصى)47.31sزمن الاستجابة (الإجمالي)100.14s
استدعاء الأدوات
: 10.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)4.31sزمن الاستجابة (الحد الأقصى)4.31sزمن الاستجابة (الإجمالي)4.31s
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 9خطأ API: 4لم يتبع التعليمات: 2زمن الاستجابة (المتوسط)811msزمن الاستجابة (الحد الأقصى)2.88sزمن الاستجابة (الإجمالي)11.35s…
إجمالي الاختبارات: 16الاختبارات الخاطئة: 15الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 14.6%اختبارات غير مستقرة: 2…رموز الإخراج: 1,185رموز الاستدلال: 0زمن الاستجابة: المتوسط 811ms · الإجمالي 11.35s · الحد الأقصى 2.88s
حيل مضادة للذكاء الاصطناعي
: 3.3 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)471msزمن الاستجابة (الحد الأقصى)872msزمن الاستجابة (الإجمالي)1.41s
مجمّع
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1زمن الاستجابة (المتوسط)0msزمن الاستجابة (الحد الأقصى)0msزمن الاستجابة (الإجمالي)0ms
تحليل البيانات واستخراجها
: 3.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2زمن الاستجابة (المتوسط)714msزمن الاستجابة (الحد الأقصى)987msزمن الاستجابة (الإجمالي)1.43s
خاص بالمجال
: 5.9 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1إجابة خاطئة: 1زمن الاستجابة (المتوسط)287msزمن الاستجابة (الحد الأقصى)334msزمن الاستجابة (الإجمالي)860ms
الذكاء العام
: 4.0 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)395msزمن الاستجابة (الحد الأقصى)395msزمن الاستجابة (الإجمالي)395ms
اتباع التعليمات
: 4.8 يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2زمن الاستجابة (المتوسط)1.09sزمن الاستجابة (الحد الأقصى)1.90sزمن الاستجابة (الإجمالي)2.18s
إجمالي الاختبارات: 1الاختبارات الخاطئة: 1الموثوقية: غير متاحقياسات الموثوقية غير متاحة أو غير مكتملة لهذا النموذج.معدل النجاح لكل محاولة: 0.0%اختبارات غير مستقرة: 0…رموز الإخراج: 0رموز الاستدلال: 0زمن الاستجابة: المتوسط 0ms · الإجمالي 0ms · الحد الأقصى 0ms