AI BENCHY
قارن
❤️ Made by XCS
Your ad here

اسم النموذج

OpenAI: GPT-5.3-Codex

الاستدلال (medium)

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في : 24‏/02‏/2026

المقياس OpenAI: GPT-5.3-Codex
الترتيب#6
الشركةOpenAI
Score 7.77
الاتساق 8.75
التكلفة لكل نتيجة 4.9342
إجمالي التكلفة $0.44408
اختبارات صحيحة
معدل النجاح لكل محاولة 76.9%
اختبارات غير مستقرة 2
رموز الإخراج 947
رموز الاستدلال 29,564
زمن الاستجابة (المتوسط)17944ms
زمن الاستجابة (الإجمالي)233267ms
زمن الاستجابة (الحد الأقصى)100927ms

تفصيل الفئات

الفئة اختبارات ناجحة بالكامل Score الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة درجة الاستدلال زمن الاستجابة (المتوسط) التكلفة
حيل مضادة للذكاء الاصطناعي 10.00 10.00 100.0% 0 6.00 4687ms $0.02371
تحليل البيانات واستخراجها 10.00 10.00 100.0% 0 1.25 3180ms $0.02600
خاص بالمجال 4.00 7.21 55.6% 1 1.00 64314ms $0.35664
اتباع التعليمات 9.00 10.00 50.0% 0 1.00 3037ms $0.01216
Puzzle Solving 7.00 7.38 77.8% 1 6.00 4610ms $0.02559

النماذج المقارنة

قارن OpenAI: GPT-5.3-Codex مع...

#5 · Google

Google: Gemini 3 Flash Preview

الاستدلال (low)

Score: 8.23

الاتساق: 8.71

معدل النجاح لكل محاولة: 82.0%

اختبارات غير مستقرة: 2

التكلفة لكل نتيجة: 0.6173

اختبارات صحيحة:

إجمالي التكلفة: $0.06174

قارن

#7 · OpenAI

OpenAI: GPT-5.2

الاستدلال (medium)

Score: 7.38

الاتساق: 8.73

معدل النجاح لكل محاولة: 76.9%

اختبارات غير مستقرة: 2

التكلفة لكل نتيجة: 2.5637

اختبارات صحيحة:

إجمالي التكلفة: $0.23074

قارن

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

الاستدلال (medium)

Score: 8.54

الاتساق: 9.35

معدل النجاح لكل محاولة: 87.2%

اختبارات غير مستقرة: 1

التكلفة لكل نتيجة: 2.1621

اختبارات صحيحة:

إجمالي التكلفة: $0.23784

قارن

مقارنة سريعة

قارن OpenAI: GPT-5.3-Codex مع...