التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

IBM: Granite 4.1 8B vs Qwen: Qwen3 Coder Next

الملخص

مقارنة benchmark بين Granite 4.1 8B و Qwen3 Coder Next: يتقدم Qwen3 Coder Next في متوسط النتيجة بـ 4.7 مقابل 4.0. لدى Granite 4.1 8B تكلفة benchmark أقل عند $0.003 مقابل $0.008. Granite 4.1 8B أسرع عند 728ms مقابل 8.58s، مع معدلات نجاح 9.5% مقابل 28.6%.

النموذج الموصى به: Granite 4.1 8B - Its score stays close to the best score here (4.0 vs 4.7), while costing about 3.0x less than Qwen3 Coder Next.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-12

المقياس Granite 4.1 8B Granite 4.1 8B none الإصدار: 2026-05-01 Qwen3 Coder Next Qwen3 Coder Next medium الإصدار: 2026-02-03
النتيجة 4.0 4.7
الترتيب #163 #153
الموثوقية 10.0 10.0
الاتساق 10.0 8.9
اختبارات صحيحة
معدل النجاح لكل محاولة 9.5% 28.6%
اختبارات غير مستقرة 0 3
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 0.131 0.201
إجمالي التكلفة $0.003 $0.008
سعر الإدخال $0.050 / 1M $0.110 / 1M
سعر الإخراج $0.100 / 1M $0.800 / 1M
إجمالي رموز الإدخال 46,285 47,250
رموز الإخراج 2,911 3,319
رموز الاستدلال 0 0
زمن الاستجابة (المتوسط) 728ms 8.58s
زمن الاستجابة (الحد الأقصى) 2.17s 81.80s
زمن الاستجابة (الإجمالي) 15.29s 128.68s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#163 IBM: Granite 4.1 8B

none
Cost
$0.001
Time
3.2s
Tokens
491 tok

#153 Qwen3 Coder Next

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 645 903 0
Qwen3 Coder Next 3.5 8.1 16.7% 1 8.64s 645 1,252 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 4.5 10.0 0.0% 0 775ms 8,344 525 0
Qwen3 Coder Next 3.7 7.2 22.2% 1 924ms 7,185 336 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 19,089 396 0
Qwen3 Coder Next 3.0 10.0 0.0% 0 4.28s 20,469 317 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 7,617 195 0
Qwen3 Coder Next 6.5 10.0 50.0% 0 81.80s 7,758 246 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 768 24 0
Qwen3 Coder Next 5.3 10.0 33.3% 0 638ms 753 25 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 528 115 0
Qwen3 Coder Next 6.3 3.4 66.7% 1 1.39s 498 142 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 687 66 0
Qwen3 Coder Next 6.3 10.0 50.0% 0 7.49s 684 63 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 3.2 10.0 0.0% 0 608ms 672 432 0
Qwen3 Coder Next 3.0 10.0 0.0% 0 1.25s 678 671 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 7,719 243 0
Qwen3 Coder Next 10.0 10.0 100.0% 0 2.64s 8,364 255 0
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 3.0 10.0 0.0% 0 306ms 216 12 0
Qwen3 Coder Next 3.0 10.0 0.0% 0 399ms 216 12 0

مقارنة سريعة

تبديل زوج المقارنة