مقارنة benchmark بين Qwen3.5 Plus 2026-02-15 vs Qwen3.6 Plus Preview vs GLM 5 Turboيتصدر GLM 5 Turbo في النتيجة بقيمة 8.4. يتصدر Qwen3.5 Plus 2026-02-15 في الموثوقية بقيمة 10.0. يمتلك Qwen3.6 Plus Preview أقل إجمالي التكلفة عند $0.000. Qwen3.6 Plus Preview هو الأسرع عند 15.25s.
النموذج الموصى به: GLM 5 Turbo - It has the best score here (8.4), while responding about 1.9x faster than النماذج الأخرى في هذه المقارنة.
تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18
GLM 5 TurboGLM 5 Turbomediumنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.الإصدار: 2026-03-15
النتيجة
8.0متوسط الدرجة عبر جميع اختبارات القياس.…
5.8متوسط الدرجة عبر جميع اختبارات القياس.…
8.4متوسط الدرجة عبر جميع اختبارات القياس.…
الترتيب
#28
#113
#21
الموثوقية
10.0درجة النجاح من المحاولة الأولى: 10.0 تعني عدم وجود إخفاقات قابلة لإعادة المحاولة من واجهة API الهدف أو حدود المعدل قبل النداءات الناجحة؛ الإخفاقات المسجلة تخفض الدرجة.…
غير متاحدرجة النجاح من المحاولة الأولى: 10.0 تعني عدم وجود إخفاقات قابلة لإعادة المحاولة من واجهة API الهدف أو حدود المعدل قبل النداءات الناجحة؛ الإخفاقات المسجلة تخفض الدرجة.…
10.0درجة النجاح من المحاولة الأولى: 10.0 تعني عدم وجود إخفاقات قابلة لإعادة المحاولة من واجهة API الهدف أو حدود المعدل قبل النداءات الناجحة؛ الإخفاقات المسجلة تخفض الدرجة.…
الاتساق
8.8تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
9.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
8.5تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
اختبارات صحيحة
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 4انتهت المهلة: 2خطأ API: 1زمن الاستجابة (المتوسط)73.79sزمن الاستجابة (الحد الأقصى)266.69sزمن الاستجابة (الإجمالي)1033.07sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 8إجابة خاطئة: 2زمن الاستجابة (المتوسط)15.25sزمن الاستجابة (الحد الأقصى)43.55sزمن الاستجابة (الإجمالي)182.96sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 4لم يتبع التعليمات: 1لا توجد إجابة: 1انتهت المهلة: 1زمن الاستجابة (المتوسط)23.00sزمن الاستجابة (الحد الأقصى)194.23sزمن الاستجابة (الإجمالي)482.97sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
معدل النجاح لكل محاولة
73.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
42.9%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
74.6%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
اختبارات غير مستقرة
3الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
4الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
إجمالي مرات التشغيل
63إجمالي مرات التشغيل…
57إجمالي مرات التشغيل…
63إجمالي مرات التشغيل…
التكلفة لكل نتيجة
2.445يعرض متوسط التكلفة لكل إجابة صحيحة في المعيار بالسنت (الأقل أفضل).…
0.000يعرض متوسط التكلفة لكل إجابة صحيحة في المعيار بالسنت (الأقل أفضل).…
2.011يعرض متوسط التكلفة لكل إجابة صحيحة في المعيار بالسنت (الأقل أفضل).…
إجمالي التكلفة
$0.310إجمالي التكلفة (السعر الحالي)…
$0.000إجمالي التكلفة (السعر الحالي)…
$0.323إجمالي التكلفة (السعر الحالي)…
سعر الإدخال
$0.260 / 1Mسعر الإدخال…
$0.000 / 1Mسعر الإدخال…
$1.200 / 1Mسعر الإدخال…
سعر الإخراج
$1.560 / 1Mسعر الإخراج…
$0.000 / 1Mسعر الإخراج…
$4.000 / 1Mسعر الإخراج…
إجمالي رموز الإدخال
40,918إجمالي رموز الإدخال…
32,639إجمالي رموز الإدخال…
35,593إجمالي رموز الإدخال…
رموز الإخراج
2,159رموز الإخراج…
1,153رموز الإخراج…
12,245رموز الإخراج…
رموز الاستدلال
189,604رموز الاستدلال…
62,197رموز الاستدلال…
62,277رموز الاستدلال…
زمن الاستجابة (المتوسط)
73.79sزمن الاستجابة (المتوسط)…
15.25sزمن الاستجابة (المتوسط)…
23.00sزمن الاستجابة (المتوسط)…
زمن الاستجابة (الحد الأقصى)
266.69sزمن الاستجابة (الحد الأقصى)…
43.55sزمن الاستجابة (الحد الأقصى)…
194.23sزمن الاستجابة (الحد الأقصى)…
زمن الاستجابة (الإجمالي)
1033.07sزمن الاستجابة (الإجمالي)…
182.96sزمن الاستجابة (الإجمالي)…
482.97sزمن الاستجابة (الإجمالي)…
عرض إنشاء
Hamster playing table tennis
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
7.9تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
83.3%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
1الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)45.78sزمن الاستجابة (الحد الأقصى)81.20sزمن الاستجابة (الإجمالي)91.57sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
45.78sزمن الاستجابة (المتوسط)…
672إجمالي رموز الإدخال…
205رموز الإخراج…
21,236رموز الاستدلال…
Qwen3.6 Plus Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
8.3متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
75.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1زمن الاستجابة (المتوسط)11.69sزمن الاستجابة (الحد الأقصى)19.37sزمن الاستجابة (الإجمالي)35.08sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
11.69sزمن الاستجابة (المتوسط)…
501إجمالي رموز الإدخال…
61رموز الإخراج…
5,812رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)4.82sزمن الاستجابة (الحد الأقصى)7.69sزمن الاستجابة (الإجمالي)19.26sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
7.1تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
44.4%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
1الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1إجابة خاطئة: 1زمن الاستجابة (المتوسط)180.70sزمن الاستجابة (الحد الأقصى)266.69sزمن الاستجابة (الإجمالي)542.10sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
180.70sزمن الاستجابة (المتوسط)…
6,950إجمالي رموز الإدخال…
420رموز الإخراج…
80,595رموز الاستدلال…
Qwen3.6 Plus Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
9.8متوسط الدرجة عبر جميع اختبارات القياس.…
3.3تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1زمن الاستجابة (المتوسط)0msزمن الاستجابة (الحد الأقصى)0msزمن الاستجابة (الإجمالي)0msيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
0msزمن الاستجابة (المتوسط)…
0إجمالي رموز الإدخال…
0رموز الإخراج…
0رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
8.2متوسط الدرجة عبر جميع اختبارات القياس.…
9.3تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
66.7%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابة: 1زمن الاستجابة (المتوسط)45.90sزمن الاستجابة (الحد الأقصى)95.57sزمن الاستجابة (الإجمالي)137.71sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)46.85sزمن الاستجابة (الحد الأقصى)46.85sزمن الاستجابة (الإجمالي)46.85sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
46.85sزمن الاستجابة (المتوسط)…
14,934إجمالي رموز الإدخال…
421رموز الإخراج…
7,906رموز الاستدلال…
Qwen3.6 Plus Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)34.95sزمن الاستجابة (الحد الأقصى)34.95sزمن الاستجابة (الإجمالي)34.95sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
34.95sزمن الاستجابة (المتوسط)…
14,934إجمالي رموز الإدخال…
452رموز الإخراج…
13,073رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)13.88sزمن الاستجابة (الحد الأقصى)13.88sزمن الاستجابة (الإجمالي)13.88sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)46.91sزمن الاستجابة (الحد الأقصى)46.91sزمن الاستجابة (الإجمالي)46.91sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
46.91sزمن الاستجابة (المتوسط)…
7,782إجمالي رموز الإدخال…
270رموز الإخراج…
14,916رموز الاستدلال…
Qwen3.6 Plus Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)14.95sزمن الاستجابة (الحد الأقصى)15.40sزمن الاستجابة (الإجمالي)29.90sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
14.95sزمن الاستجابة (المتوسط)…
7,782إجمالي رموز الإدخال…
270رموز الإخراج…
10,706رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)6.19sزمن الاستجابة (الحد الأقصى)6.42sزمن الاستجابة (الإجمالي)12.38sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
33.3%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.انتهت المهلة: 1إجابة خاطئة: 1زمن الاستجابة (المتوسط)17.50sزمن الاستجابة (الحد الأقصى)17.50sزمن الاستجابة (الإجمالي)17.50sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
17.50sزمن الاستجابة (المتوسط)…
444إجمالي رموز الإدخال…
35رموز الإخراج…
16,680رموز الاستدلال…
Qwen3.6 Plus Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
3.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2خطأ API: 1زمن الاستجابة (المتوسط)22.08sزمن الاستجابة (الحد الأقصى)43.55sزمن الاستجابة (الإجمالي)66.23sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
22.08sزمن الاستجابة (المتوسط)…
665إجمالي رموز الإدخال…
49رموز الإخراج…
26,895رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
2.9متوسط الدرجة عبر جميع اختبارات القياس.…
4.4تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
22.2%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
2الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2انتهت المهلة: 1زمن الاستجابة (المتوسط)71.07sزمن الاستجابة (الحد الأقصى)194.23sزمن الاستجابة (الإجمالي)213.22sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
1.6تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
66.7%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
1الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.انتهت المهلة: 1زمن الاستجابة (المتوسط)79.86sزمن الاستجابة (الحد الأقصى)79.86sزمن الاستجابة (الإجمالي)79.86sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
79.86sزمن الاستجابة (المتوسط)…
344إجمالي رموز الإدخال…
73رموز الإخراج…
8,675رموز الاستدلال…
Qwen3.6 Plus Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
3.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1زمن الاستجابة (المتوسط)0msزمن الاستجابة (الحد الأقصى)0msزمن الاستجابة (الإجمالي)0msيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
0msزمن الاستجابة (المتوسط)…
0إجمالي رموز الإدخال…
0رموز الإخراج…
0رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
6.1متوسط الدرجة عبر جميع اختبارات القياس.…
3.1تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
66.7%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
1الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)10.05sزمن الاستجابة (الحد الأقصى)10.05sزمن الاستجابة (الإجمالي)10.05sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)31.93sزمن الاستجابة (الحد الأقصى)31.93sزمن الاستجابة (الإجمالي)31.93sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
31.93sزمن الاستجابة (المتوسط)…
699إجمالي رموز الإدخال…
101رموز الإخراج…
7,704رموز الاستدلال…
Qwen3.6 Plus Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
6.5متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
50.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1زمن الاستجابة (المتوسط)3.40sزمن الاستجابة (الحد الأقصى)3.40sزمن الاستجابة (الإجمالي)3.40sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
3.40sزمن الاستجابة (المتوسط)…
381إجمالي رموز الإدخال…
27رموز الإخراج…
1,383رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)5.38sزمن الاستجابة (الحد الأقصى)5.70sزمن الاستجابة (الإجمالي)10.77sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)32.50sزمن الاستجابة (الحد الأقصى)49.12sزمن الاستجابة (الإجمالي)65.01sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
32.50sزمن الاستجابة (المتوسط)…
696إجمالي رموز الإدخال…
301رموز الإخراج…
13,853رموز الاستدلال…
Qwen3.6 Plus Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
5.3متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
33.3%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 2زمن الاستجابة (المتوسط)7.52sزمن الاستجابة (الحد الأقصى)7.52sزمن الاستجابة (الإجمالي)7.52sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
7.52sزمن الاستجابة (المتوسط)…
183إجمالي رموز الإدخال…
27رموز الإخراج…
2,998رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
8.7متوسط الدرجة عبر جميع اختبارات القياس.…
7.9تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
77.8%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
1الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)5.23sزمن الاستجابة (الحد الأقصى)7.26sزمن الاستجابة (الإجمالي)15.69sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)7.54sزمن الاستجابة (الحد الأقصى)7.54sزمن الاستجابة (الإجمالي)7.54sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
7.54sزمن الاستجابة (المتوسط)…
8,193إجمالي رموز الإدخال…
309رموز الإخراج…
909رموز الاستدلال…
Qwen3.6 Plus Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)5.87sزمن الاستجابة (الحد الأقصى)5.87sزمن الاستجابة (الإجمالي)5.87sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
5.87sزمن الاستجابة (المتوسط)…
8,193إجمالي رموز الإدخال…
267رموز الإخراج…
1,330رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)9.84sزمن الاستجابة (الحد الأقصى)9.84sزمن الاستجابة (الإجمالي)9.84sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)103.81sزمن الاستجابة (الحد الأقصى)103.81sزمن الاستجابة (الإجمالي)103.81sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
103.81sزمن الاستجابة (المتوسط)…
204إجمالي رموز الإدخال…
24رموز الإخراج…
17,130رموز الاستدلال…
Qwen3.6 Plus Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
3.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1زمن الاستجابة (المتوسط)0msزمن الاستجابة (الحد الأقصى)0msزمن الاستجابة (الإجمالي)0msيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
0msزمن الاستجابة (المتوسط)…
0إجمالي رموز الإدخال…
0رموز الإخراج…
0رموز الاستدلال…
GLM 5 Turboنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
3.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)40.17sزمن الاستجابة (الحد الأقصى)40.17sزمن الاستجابة (الإجمالي)40.17sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…