AI BENCHY Compare

OpenAI: GPT-5.5 vs Qwen: Qwen3.5 Plus 2026-02-15

الملخص

مقارنة benchmark بين GPT-5.5 و Qwen3.5 Plus 2026-02-15: يتقدم GPT-5.5 في متوسط النتيجة بـ 9.3 مقابل 5.8. لدى Qwen3.5 Plus 2026-02-15 تكلفة benchmark أقل عند $0.016 مقابل $0.907. Qwen3.5 Plus 2026-02-15 أسرع عند 2.31s مقابل 9.76s، مع معدلات نجاح 85.7% مقابل 46.0%.

النموذج الموصى به: GPT-5.5 - It has the strongest score in this comparison (9.3) and the best overall balance of cost and response time across all 2 models.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس	GPT-5.5 GPT-5.5 low الإصدار: 2026-04-24	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none الإصدار: 2026-02-15

المقياس	GPT-5.5 GPT-5.5 low الإصدار: 2026-04-24	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none الإصدار: 2026-02-15
النتيجة	9.3	5.8
الترتيب	#4	#106
الموثوقية	10.0	10.0
الاتساق	10.0	9.4
اختبارات صحيحة
معدل النجاح لكل محاولة	85.7%	46.0%
اختبارات غير مستقرة	0	2
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	5.035	0.204
إجمالي التكلفة	$0.907	$0.016
سعر الإدخال	$5.000 / 1M	$0.260 / 1M
سعر الإخراج	$30.000 / 1M	$1.560 / 1M
إجمالي رموز الإدخال	34,209	45,864
رموز الإخراج	2,046	2,480
رموز الاستدلال	22,460	0
زمن الاستجابة (المتوسط)	9.76s	2.31s
زمن الاستجابة (الحد الأقصى)	56.19s	6.65s
زمن الاستجابة (الإجمالي)	204.92s	34.63s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#4 GPT-5.5

low

التكلفة: $0.068
الوقت: 37.0s
الرموز: 2,339 tok

#106 Qwen3.5 Plus 2026-02-15

none

التكلفة: $0.012
الوقت: 153.2s
الرموز: 7,787 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		4.41s	606	238	1,020
Qwen3.5 Plus 2026-02-15	4.8	10.0	25.0%	0		1.91s	696	517	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		15.04s	7,302	423	6,402
Qwen3.5 Plus 2026-02-15	4.3	7.9	11.1%	1		2.05s	7,913	473	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		9.56s	11,019	303	717
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		6.65s	18,304	314	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		3.28s	7,140	228	157
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		1.89s	7,794	243	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	5.3	10.0	33.3%	0		28.05s	723	69	11,609
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		1.17s	789	17	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		5.17s	477	133	245
Qwen3.5 Plus 2026-02-15	4.4	3.0	33.3%	1		2.26s	522	117	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	9.9	10.0	100.0%	0		3.74s	660	93	415
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		1.67s	711	72	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		4.74s	642	279	954
Qwen3.5 Plus 2026-02-15	7.7	10.0	66.7%	0		2.71s	714	494	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		4.96s	5,445	250	101
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		3.33s	8,211	222	0

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	3.0	10.0	0.0%	0		10.06s	195	30	840
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		1.11s	210	11	0

مقارنة سريعة

تبديل زوج المقارنة

North Mini Codemediumمتاح مجانًاvsQwen3.5 Plus 2026-02-15none GPT-5.5lowvsQwen3.7 Maxmedium Claude Fable 5mediumvsGPT-5.5low Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Gemini 3.5 FlashmediumvsGPT-5.5low Gemini 3 Flash PreviewmediumvsGPT-5.5low Gemini 3.1 Flash LiteminimalvsQwen3.5 Plus 2026-02-15none GPT-5.5lowvsQwen3.6 Max Previewmedium Gemma 4 31Bmediumمتاح مجانًاvsQwen3.5 Plus 2026-02-15none Nemotron 3 Supermediumمتاح مجانًاvsQwen3.5 Plus 2026-02-15none Claude Opus 4.8mediumvsGPT-5.5low Gemini 3.5 FlashhighvsGPT-5.5low