التنقل
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.3-Codex vs OpenAI: GPT-5.5

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-26

المقياس GPT-5.3-Codex GPT-5.3-Codex medium الإصدار: 2026-02-05 GPT-5.5 GPT-5.5 low الإصدار: 2026-04-24
النتيجة 8.6 9.0
الترتيب #9 #5
الموثوقية غير متاح 10.0
الاتساق 8.7 9.6
اختبارات صحيحة
معدل النجاح لكل محاولة 83.3% 87.0%
اختبارات غير مستقرة 3 1
إجمالي مرات التشغيل 54 54
التكلفة لكل نتيجة 4.405 4.534
إجمالي التكلفة $0.573 $0.681
??? ??????? $1.750 / 1M $5.000 / 1M
??? ??????? $14.000 / 1M $30.000 / 1M
رموز الإخراج 2,279 1,959
رموز الاستدلال 35,179 16,134
زمن الاستجابة (المتوسط) 15.38s 8.39s
زمن الاستجابة (الحد الأقصى) 100.93s 56.19s
زمن الاستجابة (الإجمالي) 276.91s 151.01s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
GPT-5.5 10.0 10.0 100.0% 0 4.15s 232 1,056
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
GPT-5.3-Codex 10.0 10.0 100.0% 0 8.95s 491 1,530
GPT-5.5 10.0 10.0 100.0% 0 7.79s 369 936
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
GPT-5.5 10.0 10.0 100.0% 0 9.56s 303 717
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
GPT-5.5 10.0 10.0 100.0% 0 3.28s 228 157
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
GPT-5.5 5.3 10.0 33.3% 0 27.57s 69 11,731
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
GPT-5.5 10.0 10.0 100.0% 0 3.45s 143 132
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
GPT-5.5 9.9 10.0 100.0% 0 2.98s 93 356
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
GPT-5.5 9.0 7.9 88.9% 1 4.48s 272 948
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492
GPT-5.5 10.0 10.0 100.0% 0 4.96s 250 101

مقارنة سريعة

تبديل زوج المقارنة