التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

IBM: Granite 4.1 8B vs OpenAI: GPT-5.5

الملخص

مقارنة benchmark بين Granite 4.1 8B و GPT-5.5: يتقدم GPT-5.5 في متوسط النتيجة بـ 9.3 مقابل 4.0. لدى Granite 4.1 8B تكلفة benchmark أقل عند $0.003 مقابل $0.907. Granite 4.1 8B أسرع عند 728ms مقابل 9.76s، مع معدلات نجاح 9.5% مقابل 85.7%.

النموذج الموصى به: Granite 4.1 8B - It offers the best overall trade-off: a competitive score (4.0), lower cost than GPT-5.5, and balanced response time.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-12

المقياس Granite 4.1 8B Granite 4.1 8B none الإصدار: 2026-05-01 GPT-5.5 GPT-5.5 low الإصدار: 2026-04-24
النتيجة 4.0 9.3
الترتيب #163 #5
الموثوقية 10.0 10.0
الاتساق 10.0 10.0
اختبارات صحيحة
معدل النجاح لكل محاولة 9.5% 85.7%
اختبارات غير مستقرة 0 0
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 0.131 5.035
إجمالي التكلفة $0.003 $0.907
سعر الإدخال $0.050 / 1M $5.000 / 1M
سعر الإخراج $0.100 / 1M $30.000 / 1M
إجمالي رموز الإدخال 46,285 34,209
رموز الإخراج 2,911 2,046
رموز الاستدلال 0 22,460
زمن الاستجابة (المتوسط) 728ms 9.76s
زمن الاستجابة (الحد الأقصى) 2.17s 56.19s
زمن الاستجابة (الإجمالي) 15.29s 204.92s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#163 IBM: Granite 4.1 8B

none
Cost
$0.001
Time
3.2s
Tokens
491 tok

#5 GPT-5.5

low
Cost
$0.068
Time
37.0s
Tokens
2,339 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 645 903 0
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 4.5 10.0 0.0% 0 775ms 8,344 525 0
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 19,089 396 0
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 7,617 195 0
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 768 24 0
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 528 115 0
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 687 66 0
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 3.2 10.0 0.0% 0 608ms 672 432 0
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 7,719 243 0
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Granite 4.1 8B 3.0 10.0 0.0% 0 306ms 216 12 0
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840

مقارنة سريعة

تبديل زوج المقارنة