التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

النماذج المقارنة

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-30

المقياس Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium الإصدار: 2026-02-15 Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium الإصدار: تاريخ الإصدار غير معروف متاح مجانًا GLM 5 Turbo GLM 5 Turbo medium الإصدار: 2026-03-15
النتيجة 8.4 8.5 8.0
الترتيب #9 #6 #17
الاتساق 9.0 10.0 7.9
اختبارات صحيحة
معدل النجاح لكل محاولة 82.4% 76.5% 76.5%
اختبارات غير مستقرة 2 0 5
إجمالي مرات التشغيل 51 49 51
التكلفة لكل نتيجة 1.448 0.000 1.509
إجمالي التكلفة $0.189 $0.000 $0.166
??? ??????? $0.260 / 1M $0.000 / 1M $1.200 / 1M
??? ??????? $1.560 / 1M $0.000 / 1M $4.000 / 1M
رموز الإخراج 1,754 1,756 11,865
رموز الاستدلال 92,522 77,213 35,632
زمن الاستجابة (المتوسط) 39.13s 13.94s 17.98s
زمن الاستجابة (الحد الأقصى) 81.20s 43.55s 194.23s
زمن الاستجابة (الإجمالي) 391.29s 237.01s 305.72s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5 Plus 2026-02-15 8.2 7.9 83.3% 1 45.78s 205 21,236
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 9.90s 207 7,557
GLM 5 Turbo 10.0 10.0 100.0% 0 4.82s 362 3,137
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.85s 421 7,906
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 34.95s 452 13,073
GLM 5 Turbo 10.0 10.0 100.0% 0 13.88s 390 2,037
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.91s 270 14,916
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 14.95s 270 10,706
GLM 5 Turbo 10.0 10.0 100.0% 0 6.19s 577 3,632
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 17.50s 35 16,680
Qwen3.6 Plus Preview 3.0 10.0 0.0% 0 22.08s 49 26,895
GLM 5 Turbo 2.9 4.4 22.2% 2 71.07s 9,665 19,279
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5 Plus 2026-02-15 4.7 1.6 66.7% 1 79.86s 73 8,675
Qwen3.6 Plus Preview 5.1 10.0 0.0% 0 27.05s 111 5,232
GLM 5 Turbo 6.1 3.1 66.7% 1 10.05s 60 2,216
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 31.93s 101 7,704
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 7.54s 102 5,552
GLM 5 Turbo 10.0 10.0 100.0% 0 5.38s 255 2,183
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 34.57s 340 14,496
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 6.11s 298 6,868
GLM 5 Turbo 7.3 5.8 55.6% 2 5.44s 315 2,702
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 7.54s 309 909
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 5.87s 267 1,330
GLM 5 Turbo 10.0 10.0 100.0% 0 9.84s 241 446

مقارنة سريعة

تبديل زوج المقارنة