التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemma 4 26B A4B vs OpenAI: GPT-5.5

الملخص

مقارنة benchmark بين Gemma 4 26B A4B و GPT-5.5: يتقدم GPT-5.5 في متوسط النتيجة بـ 9.3 مقابل 5.5. لدى Gemma 4 26B A4B تكلفة benchmark أقل عند $0.004 مقابل $0.907. Gemma 4 26B A4B أسرع عند 5.91s مقابل 9.76s، مع معدلات نجاح 44.4% مقابل 85.7%.

النموذج الموصى به: GPT-5.5 - It has the strongest score in this comparison (9.3) and the best overall balance of cost and response time across all 2 models.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-02

المقياس Gemma 4 26B A4B Gemma 4 26B A4B none الإصدار: 2026-04-03 متاح مجانًا GPT-5.5 GPT-5.5 low الإصدار: 2026-04-24
النتيجة 5.5 9.3
الترتيب #125 #4
الموثوقية 10.0 10.0
الاتساق 9.2 10.0
اختبارات صحيحة
معدل النجاح لكل محاولة 44.4% 85.7%
اختبارات غير مستقرة 2 0
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 0.068 5.035
إجمالي التكلفة $0.004 $0.907
سعر الإدخال $0.060 / 1M $5.000 / 1M
سعر الإخراج $0.330 / 1M $30.000 / 1M
إجمالي رموز الإدخال 40,038 34,209
رموز الإخراج 1,824 2,046
رموز الاستدلال 0 22,460
زمن الاستجابة (المتوسط) 5.91s 9.76s
زمن الاستجابة (الحد الأقصى) 57.10s 56.19s
زمن الاستجابة (الإجمالي) 124.05s 204.92s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#125 Gemma 4 26B A4B

none
التكلفة
$0.001
الوقت
39.5s
الرموز
790 tok

#4 GPT-5.5

low
التكلفة
$0.068
الوقت
37.0s
الرموز
2,339 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 8.3 10.0 75.0% 0 1.28s 852 230 0
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 3.7 7.2 22.2% 1 4.16s 7,736 476 0
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 3.0 10.0 0.0% 0 30.53s 13,650 309 0
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 10.0 10.0 100.0% 0 1.70s 8,352 285 0
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 3.6 7.2 22.2% 1 2.49s 903 27 0
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 4.0 10.0 0.0% 0 3.54s 576 85 0
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 6.3 10.0 50.0% 0 690ms 795 75 0
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 6.2 10.0 33.3% 0 744ms 828 114 0
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 10.0 10.0 100.0% 0 57.10s 6,123 210 0
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 3.0 10.0 0.0% 0 778ms 223 13 0
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840

مقارنة سريعة

تبديل زوج المقارنة