مقارنة benchmark بين Gemma 4 31B vs Gemini 3 PRO Preview vs GLM 5 Turboيتصدر GLM 5 Turbo في النتيجة بقيمة 8.4. يتصدر Gemma 4 31B في الموثوقية بقيمة 10.0. يمتلك Gemma 4 31B أقل إجمالي التكلفة عند $0.033. Gemini 3 PRO Preview هو الأسرع عند 9.05s.
النموذج الموصى به: GLM 5 Turbo - It has the strongest score in this comparison (8.4) and the best overall balance of cost and response time across all 3 models.
تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-02
GLM 5 TurboGLM 5 Turbomediumنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.الإصدار: 2026-03-15
النتيجة
6.3متوسط الدرجة عبر جميع اختبارات القياس.…
6.2متوسط الدرجة عبر جميع اختبارات القياس.…
8.4متوسط الدرجة عبر جميع اختبارات القياس.…
الترتيب
#91
#94
#21
الموثوقية
10.0درجة النجاح من المحاولة الأولى: 10.0 تعني عدم وجود إخفاقات قابلة لإعادة المحاولة من واجهة API الهدف أو حدود المعدل قبل النداءات الناجحة؛ الإخفاقات المسجلة تخفض الدرجة.…
غير متاحدرجة النجاح من المحاولة الأولى: 10.0 تعني عدم وجود إخفاقات قابلة لإعادة المحاولة من واجهة API الهدف أو حدود المعدل قبل النداءات الناجحة؛ الإخفاقات المسجلة تخفض الدرجة.…
10.0درجة النجاح من المحاولة الأولى: 10.0 تعني عدم وجود إخفاقات قابلة لإعادة المحاولة من واجهة API الهدف أو حدود المعدل قبل النداءات الناجحة؛ الإخفاقات المسجلة تخفض الدرجة.…
الاتساق
9.4تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
8.5تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
اختبارات صحيحة
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 2انتهت المهلة: 2إجابة خاطئة: 2لا توجد إجابة: 1زمن الاستجابة (المتوسط)56.55sزمن الاستجابة (الحد الأقصى)437.40sزمن الاستجابة (الإجمالي)1074.41sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 4إجابة خاطئة: 3زمن الاستجابة (المتوسط)9.05sزمن الاستجابة (الحد الأقصى)26.24sزمن الاستجابة (الإجمالي)90.53sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 4لم يتبع التعليمات: 1لا توجد إجابة: 1انتهت المهلة: 1زمن الاستجابة (المتوسط)23.00sزمن الاستجابة (الحد الأقصى)194.23sزمن الاستجابة (الإجمالي)482.97sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
معدل النجاح لكل محاولة
69.8%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
66.7%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
74.6%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
اختبارات غير مستقرة
1الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
4الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
إجمالي مرات التشغيل
63إجمالي مرات التشغيل…
63إجمالي مرات التشغيل…
63إجمالي مرات التشغيل…
التكلفة لكل نتيجة
0.257يعرض متوسط التكلفة لكل إجابة صحيحة في المعيار بالسنت (الأقل أفضل).…
1.406يعرض متوسط التكلفة لكل إجابة صحيحة في المعيار بالسنت (الأقل أفضل).…
2.011يعرض متوسط التكلفة لكل إجابة صحيحة في المعيار بالسنت (الأقل أفضل).…
إجمالي التكلفة
$0.033إجمالي التكلفة (السعر الحالي)…
$0.385إجمالي التكلفة (السعر الحالي)…
$0.323إجمالي التكلفة (السعر الحالي)…
سعر الإدخال
$0.120 / 1Mسعر الإدخال…
$9.506 / 1Mسعر الإدخال…
$1.200 / 1Mسعر الإدخال…
سعر الإخراج
$0.350 / 1Mسعر الإخراج…
$9.506 / 1Mسعر الإخراج…
$4.000 / 1Mسعر الإخراج…
إجمالي رموز الإدخال
17,957إجمالي رموز الإدخال…
28,848إجمالي رموز الإدخال…
35,593إجمالي رموز الإدخال…
رموز الإخراج
22,356رموز الإخراج…
1,490رموز الإخراج…
12,245رموز الإخراج…
رموز الاستدلال
65,726رموز الاستدلال…
10,102رموز الاستدلال…
62,277رموز الاستدلال…
زمن الاستجابة (المتوسط)
56.55sزمن الاستجابة (المتوسط)…
9.05sزمن الاستجابة (المتوسط)…
23.00sزمن الاستجابة (المتوسط)…
زمن الاستجابة (الحد الأقصى)
437.40sزمن الاستجابة (الحد الأقصى)…
26.24sزمن الاستجابة (الحد الأقصى)…
194.23sزمن الاستجابة (الحد الأقصى)…
زمن الاستجابة (الإجمالي)
1074.41sزمن الاستجابة (الإجمالي)…
90.53sزمن الاستجابة (الإجمالي)…
482.97sزمن الاستجابة (الإجمالي)…
عرض إنشاء
Hamster playing table tennis
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
#91 Gemma 4 31B
medium
التكلفة
$0.002
الوقت
45.7s
الرموز
2,696 tok
#94 Gemini 3 PRO Preview
medium
No endpoints found for google/gemini-3-pro-preview.
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)12.89sزمن الاستجابة (الحد الأقصى)26.66sزمن الاستجابة (الإجمالي)51.55sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
12.89sزمن الاستجابة (المتوسط)…
816إجمالي رموز الإدخال…
962رموز الإخراج…
2,046رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)14.99sزمن الاستجابة (الحد الأقصى)26.24sزمن الاستجابة (الإجمالي)29.99sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
14.99sزمن الاستجابة (المتوسط)…
500إجمالي رموز الإدخال…
149رموز الإخراج…
1,485رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)4.82sزمن الاستجابة (الحد الأقصى)7.69sزمن الاستجابة (الإجمالي)19.26sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
5.8تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
22.2%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
1الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.انتهت المهلة: 2لا توجد إجابة: 1زمن الاستجابة (المتوسط)219.76sزمن الاستجابة (الحد الأقصى)437.40sزمن الاستجابة (الإجمالي)659.27sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
219.76sزمن الاستجابة (المتوسط)…
5,568إجمالي رموز الإدخال…
11,098رموز الإخراج…
33,212رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
3.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 3زمن الاستجابة (المتوسط)0msزمن الاستجابة (الحد الأقصى)0msزمن الاستجابة (الإجمالي)0msيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
0msزمن الاستجابة (المتوسط)…
0إجمالي رموز الإدخال…
0رموز الإخراج…
0رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
8.2متوسط الدرجة عبر جميع اختبارات القياس.…
9.3تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
66.7%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابة: 1زمن الاستجابة (المتوسط)45.90sزمن الاستجابة (الحد الأقصى)95.57sزمن الاستجابة (الإجمالي)137.71sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1زمن الاستجابة (المتوسط)0msزمن الاستجابة (الحد الأقصى)0msزمن الاستجابة (الإجمالي)0msيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
0msزمن الاستجابة (المتوسط)…
0إجمالي رموز الإدخال…
0رموز الإخراج…
0رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
3.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)10.37sزمن الاستجابة (الحد الأقصى)10.37sزمن الاستجابة (الإجمالي)10.37sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.37sزمن الاستجابة (المتوسط)…
13,211إجمالي رموز الإدخال…
351رموز الإخراج…
952رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)13.88sزمن الاستجابة (الحد الأقصى)13.88sزمن الاستجابة (الإجمالي)13.88sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)21.11sزمن الاستجابة (الحد الأقصى)21.94sزمن الاستجابة (الإجمالي)42.21sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
21.11sزمن الاستجابة (المتوسط)…
8,334إجمالي رموز الإدخال…
1,822رموز الإخراج…
2,951رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)10.84sزمن الاستجابة (الحد الأقصى)10.84sزمن الاستجابة (الإجمالي)10.84sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.84sزمن الاستجابة (المتوسط)…
7,259إجمالي رموز الإدخال…
279رموز الإخراج…
3,156رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)6.19sزمن الاستجابة (الحد الأقصى)6.42sزمن الاستجابة (الإجمالي)12.38sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
66.7%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)38.48sزمن الاستجابة (الحد الأقصى)68.92sزمن الاستجابة (الإجمالي)115.43sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
38.48sزمن الاستجابة (المتوسط)…
876إجمالي رموز الإدخال…
4,349رموز الإخراج…
8,985رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
5.3متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
33.3%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2زمن الاستجابة (المتوسط)7.01sزمن الاستجابة (الحد الأقصى)7.01sزمن الاستجابة (الإجمالي)7.01sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
7.01sزمن الاستجابة (المتوسط)…
643إجمالي رموز الإدخال…
15رموز الإخراج…
1,195رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
2.9متوسط الدرجة عبر جميع اختبارات القياس.…
4.4تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
22.2%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
2الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2انتهت المهلة: 1زمن الاستجابة (المتوسط)71.07sزمن الاستجابة (الحد الأقصى)194.23sزمن الاستجابة (الإجمالي)213.22sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)9.57sزمن الاستجابة (الحد الأقصى)9.57sزمن الاستجابة (الإجمالي)9.57sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
9.57sزمن الاستجابة (المتوسط)…
567إجمالي رموز الإدخال…
105رموز الإخراج…
888رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)9.34sزمن الاستجابة (الحد الأقصى)9.34sزمن الاستجابة (الإجمالي)9.34sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
9.34sزمن الاستجابة (المتوسط)…
486إجمالي رموز الإدخال…
78رموز الإخراج…
374رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
6.1متوسط الدرجة عبر جميع اختبارات القياس.…
3.1تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
66.7%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
1الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)10.05sزمن الاستجابة (الحد الأقصى)10.05sزمن الاستجابة (الإجمالي)10.05sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)12.76sزمن الاستجابة (الحد الأقصى)17.53sزمن الاستجابة (الإجمالي)25.52sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
12.76sزمن الاستجابة (المتوسط)…
777إجمالي رموز الإدخال…
533رموز الإخراج…
2,035رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
9.8متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)3.26sزمن الاستجابة (الحد الأقصى)3.26sزمن الاستجابة (الإجمالي)3.26sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
3.26sزمن الاستجابة (المتوسط)…
623إجمالي رموز الإدخال…
69رموز الإخراج…
754رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)5.38sزمن الاستجابة (الحد الأقصى)5.70sزمن الاستجابة (الإجمالي)10.77sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)26.91sزمن الاستجابة (الحد الأقصى)61.08sزمن الاستجابة (الإجمالي)80.72sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
26.91sزمن الاستجابة (المتوسط)…
801إجمالي رموز الإدخال…
1,795رموز الإخراج…
5,595رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)3.88sزمن الاستجابة (الحد الأقصى)4.23sزمن الاستجابة (الإجمالي)7.77sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
3.88sزمن الاستجابة (المتوسط)…
570إجمالي رموز الإدخال…
225رموز الإخراج…
1,215رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
8.7متوسط الدرجة عبر جميع اختبارات القياس.…
7.9تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
77.8%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
1الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)5.23sزمن الاستجابة (الحد الأقصى)7.26sزمن الاستجابة (الإجمالي)15.69sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1زمن الاستجابة (المتوسط)0msزمن الاستجابة (الحد الأقصى)0msزمن الاستجابة (الإجمالي)0msيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
0msزمن الاستجابة (المتوسط)…
0إجمالي رموز الإدخال…
0رموز الإخراج…
0رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)11.96sزمن الاستجابة (الحد الأقصى)11.96sزمن الاستجابة (الإجمالي)11.96sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
11.96sزمن الاستجابة (المتوسط)…
5,556إجمالي رموز الإدخال…
324رموز الإخراج…
971رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)9.84sزمن الاستجابة (الحد الأقصى)9.84sزمن الاستجابة (الإجمالي)9.84sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)90.14sزمن الاستجابة (الحد الأقصى)90.14sزمن الاستجابة (الإجمالي)90.14sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
90.14sزمن الاستجابة (المتوسط)…
218إجمالي رموز الإدخال…
1,692رموز الإخراج…
10,014رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
3.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1زمن الاستجابة (المتوسط)0msزمن الاستجابة (الحد الأقصى)0msزمن الاستجابة (الإجمالي)0msيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
0msزمن الاستجابة (المتوسط)…
0إجمالي رموز الإدخال…
0رموز الإخراج…
0رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
3.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)40.17sزمن الاستجابة (الحد الأقصى)40.17sزمن الاستجابة (الإجمالي)40.17sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…