التنقل
AI BENCHY
Your ad here

AI BENCHY Compare

IBM: Granite 4.1 8B vs Qwen: Qwen3.5-9B

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-01

المقياس Granite 4.1 8B Granite 4.1 8B none الإصدار: 2026-05-01 Qwen3.5-9B Qwen3.5-9B medium الإصدار: 2026-03-02
النتيجة 4.3 4.4
الترتيب #135 #132
الموثوقية 10.0 غير متاح
الاتساق 10.0 7.2
اختبارات صحيحة
معدل النجاح لكل محاولة 11.1% 33.3%
اختبارات غير مستقرة 0 6
إجمالي مرات التشغيل 54 54
التكلفة لكل نتيجة 0.110 0.976
إجمالي التكلفة $0.003 $0.030
??? ??????? $0.050 / 1M $0.100 / 1M
??? ??????? $0.100 / 1M $0.150 / 1M
رموز الإخراج 2,712 24,291
رموز الاستدلال 0 172,597
زمن الاستجابة (المتوسط) 767ms 73.64s
زمن الاستجابة (الحد الأقصى) 2.17s 226.38s
زمن الاستجابة (الإجمالي) 13.81s 1104.60s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 903 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 2,621 12,411
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Granite 4.1 8B 6.9 10.0 0.0% 0 1.07s 339 0
Qwen3.5-9B 2.6 10.0 0.0% 0 135.61s 6,150 31,393
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 396 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 195 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 1,383 32,113
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 24 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 11,549 48,475
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 115 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 0 30,695
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 66 0
Qwen3.5-9B 6.4 5.8 66.7% 1 17.15s 599 4,517
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Granite 4.1 8B 3.7 10.0 0.0% 0 635ms 431 0
Qwen3.5-9B 3.1 10.0 0.0% 0 33.38s 1,545 11,844
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 243 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 444 1,149

مقارنة سريعة

تبديل زوج المقارنة