التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.5-Flash vs xAI: Grok Build 0.1

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-28

المقياس Qwen3.5-Flash Qwen3.5-Flash medium الإصدار: 2026-02-24 Grok Build 0.1 Grok Build 0.1 medium الإصدار: 2026-05-21
النتيجة 7.6 7.7
الترتيب #48 #43
الموثوقية 10.0 10.0
الاتساق 8.0 9.9
اختبارات صحيحة
معدل النجاح لكل محاولة 75.0% 65.0%
اختبارات غير مستقرة 5 0
إجمالي مرات التشغيل 60 60
التكلفة لكل نتيجة 0.821 5.606
إجمالي التكلفة $0.074 $0.729
سعر الإدخال $0.065 / 1M $1.000 / 1M
سعر الإخراج $0.260 / 1M $2.000 / 1M
رموز الإخراج 2,074 2,258
رموز الاستدلال 272,063 341,381
زمن الاستجابة (المتوسط) 63.04s 42.39s
زمن الاستجابة (الحد الأقصى) 234.29s 252.69s
زمن الاستجابة (الإجمالي) 1197.71s 847.76s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 383 32,992
Grok Build 0.1 8.3 10.0 75.0% 0 7.43s 220 12,162
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 4.1 5.8 33.3% 1 54.23s 288 67,546
Grok Build 0.1 7.0 9.5 50.0% 0 62.62s 614 64,815
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 483 8,270
Grok Build 0.1 10.0 10.0 100.0% 0 32.81s 231 16,917
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 235 16,237
Grok Build 0.1 10.0 10.0 100.0% 0 10.72s 180 8,876
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 58 43,615
Grok Build 0.1 5.3 10.0 33.3% 0 158.00s 492 175,294
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 99 38,486
Grok Build 0.1 4.4 9.9 0.0% 0 18.41s 76 6,345
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 98 14,139
Grok Build 0.1 9.8 10.0 100.0% 0 12.36s 57 9,599
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 8.2 7.2 88.9% 1 27.61s 89 12,457
Grok Build 0.1 7.7 10.0 66.7% 0 18.26s 195 20,841
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 309 1,284
Grok Build 0.1 10.0 10.0 100.0% 0 13.12s 180 4,969
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Qwen3.5-Flash 3.0 10.0 0.0% 0 48.98s 32 37,037
Grok Build 0.1 3.0 10.0 0.0% 0 53.51s 13 21,563

مقارنة سريعة

تبديل زوج المقارنة