AI BENCHY Compare

OpenAI: GPT-5.5 vs OpenAI: GPT-5 Nano

الملخص

مقارنة benchmark بين GPT-5.5 و GPT-5 Nano: يتقدم GPT-5.5 في متوسط النتيجة بـ 9.3 مقابل 6.7. لدى GPT-5 Nano تكلفة benchmark أقل عند $0.081 مقابل $0.907. GPT-5.5 أسرع عند 9.76s مقابل 42.51s، مع معدلات نجاح 85.7% مقابل 57.1%.

النموذج الموصى به: GPT-5.5 - It has the best score here (9.3), while responding about 4.4x faster than GPT-5 Nano.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-02

المقياس	GPT-5.5 GPT-5.5 low الإصدار: 2026-04-24	GPT-5 Nano GPT-5 Nano medium الإصدار: 2025-08-07

المقياس	GPT-5.5 GPT-5.5 low الإصدار: 2026-04-24	GPT-5 Nano GPT-5 Nano medium الإصدار: 2025-08-07
النتيجة	9.3	6.7
الترتيب	#4	#82
الموثوقية	10.0	10.0
الاتساق	10.0	7.3
اختبارات صحيحة
معدل النجاح لكل محاولة	85.7%	57.1%
اختبارات غير مستقرة	0	7
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	5.035	0.897
إجمالي التكلفة	$0.907	$0.081
سعر الإدخال	$5.000 / 1M	$0.050 / 1M
سعر الإخراج	$30.000 / 1M	$0.400 / 1M
إجمالي رموز الإدخال	34,209	34,108
رموز الإخراج	2,046	5,464
رموز الاستدلال	22,460	192,064
زمن الاستجابة (المتوسط)	9.76s	42.51s
زمن الاستجابة (الحد الأقصى)	56.19s	204.02s
زمن الاستجابة (الإجمالي)	204.92s	595.09s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#4 GPT-5.5

low

التكلفة: $0.068
الوقت: 37.0s
الرموز: 2,339 tok

#82 GPT-5 Nano

medium

التكلفة: $0.006
الوقت: 108.5s
الرموز: 13,209 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		4.41s	606	238	1,020
GPT-5 Nano	6.5	7.9	58.3%	1		25.50s	606	1,221	21,184

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		15.04s	7,302	423	6,402
GPT-5 Nano	7.0	7.7	55.6%	1		41.62s	7,305	740	41,152

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		9.56s	11,019	303	717
GPT-5 Nano	10.0	10.0	100.0%	0		65.96s	11,019	578	17,984

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		3.28s	7,140	228	157
GPT-5 Nano	3.7	1.7	50.0%	2		21.42s	7,140	453	10,560

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	5.3	10.0	33.3%	0		28.05s	723	69	11,609
GPT-5 Nano	5.2	4.4	55.6%	2		204.02s	619	237	64,448

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		5.17s	477	133	245
GPT-5 Nano	4.1	10.0	0.0%	0		17.51s	477	202	4,608

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	9.9	10.0	100.0%	0		3.74s	660	93	415
GPT-5 Nano	9.8	10.0	100.0%	0		15.64s	660	312	4,736

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		4.74s	642	279	954
GPT-5 Nano	5.3	7.2	44.4%	1		20.63s	642	929	14,272

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		4.96s	5,445	250	101
GPT-5 Nano	10.0	10.0	100.0%	0		33.30s	5,445	558	6,976

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	3.0	10.0	0.0%	0		10.06s	195	30	840
GPT-5 Nano	3.0	10.0	0.0%	0		20.13s	195	234	6,144

مقارنة سريعة

تبديل زوج المقارنة

GPT-5.5lowvsQwen3.7 Maxmedium Claude Fable 5mediumvsGPT-5.5low Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Gemini 3.1 Flash Lite PreviewlowvsGPT-5 Nanomedium Gemini 3.5 FlashminimalvsGPT-5 Nanomedium GPT-5 NanomediumvsQwen3.7 Maxnone Gemini 3.5 FlashmediumvsGPT-5.5low Gemini 3.1 Flash Lite PreviewnonevsGPT-5 Nanomedium Gemini 3.1 Flash LitelowvsGPT-5 Nanomedium Gemini 3 Flash PreviewnonevsGPT-5 Nanomedium Gemini 3 Flash PreviewmediumvsGPT-5.5low Gemini 3.5 FlashnonevsGPT-5 Nanomedium