التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs OpenAI: GPT-5.4 Nano

الملخص

مقارنة benchmark بين GPT-5.3 Chat و GPT-5.4 Nano: متوسط النتيجة متقارب جدًا عند 7.5 مقابل 7.5. لدى GPT-5.4 Nano تكلفة benchmark أقل عند $0.107 مقابل $0.433. GPT-5.3 Chat أسرع عند 6.34s مقابل 11.95s، مع معدلات نجاح 66.7% مقابل 63.5%.

النموذج الموصى به: GPT-5.4 Nano - It has the best score here (7.5), while costing about 4.1x less than GPT-5.3 Chat.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-12

المقياس GPT-5.3 Chat GPT-5.3 Chat none الإصدار: 2026-03-03 GPT-5.4 Nano GPT-5.4 Nano medium الإصدار: 2026-03-17
النتيجة 7.5 7.5
الترتيب #47 #48
الموثوقية 10.0 10.0
الاتساق 8.1 8.4
اختبارات صحيحة
معدل النجاح لكل محاولة 66.7% 63.5%
اختبارات غير مستقرة 5 4
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 3.605 0.969
إجمالي التكلفة $0.433 $0.107
سعر الإدخال $1.750 / 1M $0.200 / 1M
سعر الإخراج $14.000 / 1M $1.250 / 1M
إجمالي رموز الإدخال 34,209 35,434
رموز الإخراج 26,617 3,014
رموز الاستدلال 0 76,520
زمن الاستجابة (المتوسط) 6.34s 11.95s
زمن الاستجابة (الحد الأقصى) 18.33s 94.06s
زمن الاستجابة (الإجمالي) 133.13s 250.98s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#47 GPT-5.3 Chat

none
Cost
$0.008
Time
8.1s
Tokens
634 tok

#48 GPT-5.4 Nano

medium
Cost
$0.007
Time
24.6s
Tokens
4,943 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 606 3,167 0
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 606 683 2,254
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.3 Chat 5.6 4.7 55.6% 2 10.52s 7,302 6,632 0
GPT-5.4 Nano 6.1 4.7 66.7% 2 19.12s 7,305 516 20,778
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 11,019 2,614 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 12,345 349 5,719
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 7,140 942 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 7,140 234 516
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 723 8,264 0
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 619 60 43,325
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 477 319 0
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 477 179 443
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 660 1,491 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 660 95 521
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 642 1,758 0
GPT-5.4 Nano 4.1 7.2 22.2% 1 3.79s 642 594 1,408
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 5,445 861 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 5,445 234 382
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 195 569 0
GPT-5.4 Nano 3.0 10.0 0.0% 0 4.81s 195 70 1,174

مقارنة سريعة

تبديل زوج المقارنة