AI BENCHY Compare

OpenAI: GPT-5.5 vs Qwen: Qwen3 Coder Next

الملخص

مقارنة benchmark بين GPT-5.5 و Qwen3 Coder Next: يتقدم GPT-5.5 في متوسط النتيجة بـ 9.3 مقابل 5.1. لدى Qwen3 Coder Next تكلفة benchmark أقل عند $0.009 مقابل $0.907. Qwen3 Coder Next أسرع عند 8.62s مقابل 9.76s، مع معدلات نجاح 85.7% مقابل 27.0%.

النموذج الموصى به: GPT-5.5 - It has the strongest score in this comparison (9.3) and the best overall balance of cost and response time across all 2 models.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-02

المقياس	GPT-5.5 GPT-5.5 low الإصدار: 2026-04-24	Qwen3 Coder Next Qwen3 Coder Next none الإصدار: 2026-02-03

المقياس	GPT-5.5 GPT-5.5 low الإصدار: 2026-04-24	Qwen3 Coder Next Qwen3 Coder Next none الإصدار: 2026-02-03
النتيجة	9.3	5.1
الترتيب	#4	#135
الموثوقية	10.0	10.0
الاتساق	10.0	9.7
اختبارات صحيحة
معدل النجاح لكل محاولة	85.7%	27.0%
اختبارات غير مستقرة	0	1
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	5.035	0.165
إجمالي التكلفة	$0.907	$0.009
سعر الإدخال	$5.000 / 1M	$0.110 / 1M
سعر الإخراج	$30.000 / 1M	$0.800 / 1M
إجمالي رموز الإدخال	34,209	47,507
رموز الإخراج	2,046	3,584
رموز الاستدلال	22,460	0
زمن الاستجابة (المتوسط)	9.76s	8.62s
زمن الاستجابة (الحد الأقصى)	56.19s	45.14s
زمن الاستجابة (الإجمالي)	204.92s	129.37s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#4 GPT-5.5

low

التكلفة: $0.068
الوقت: 37.0s
الرموز: 2,339 tok

#135 Qwen3 Coder Next

none

SVG غير صالح

التكلفة: $0.058
الوقت: 246.3s
الرموز: 64,126 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		4.41s	606	238	1,020
Qwen3 Coder Next	3.6	10.0	0.0%	0		3.31s	645	1,321	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		15.04s	7,302	423	6,402
Qwen3 Coder Next	4.6	7.9	22.2%	1		2.22s	7,442	621	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		9.56s	11,019	303	717
Qwen3 Coder Next	3.0	10.0	0.0%	0		45.14s	20,469	317	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		3.28s	7,140	228	157
Qwen3 Coder Next	6.5	10.0	50.0%	0		1.32s	7,758	246	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	5.3	10.0	33.3%	0		28.05s	723	69	11,609
Qwen3 Coder Next	5.3	10.0	33.3%	0		962ms	753	26	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		5.17s	477	133	245
Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	498	152	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	9.9	10.0	100.0%	0		3.74s	660	93	415
Qwen3 Coder Next	6.3	10.0	50.0%	0		7.78s	684	63	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		4.74s	642	279	954
Qwen3 Coder Next	3.0	10.0	0.0%	0		24.34s	678	571	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		4.96s	5,445	250	101
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	8,364	255	0

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.5	3.0	10.0	0.0%	0		10.06s	195	30	840
Qwen3 Coder Next	3.0	10.0	0.0%	0		601ms	216	12	0

مقارنة سريعة

تبديل زوج المقارنة

Mistral Small 4mediumvsQwen3 Coder Nextnone GPT-5.5lowvsQwen3.7 Maxmedium MiniMax M2.7mediumvsQwen3 Coder Nextnone Claude Fable 5mediumvsGPT-5.5low Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Gemini 3.5 FlashmediumvsGPT-5.5low CobuddymediumvsQwen3 Coder Nextnone Gemini 3 Flash PreviewmediumvsGPT-5.5low MiniMax M2.5mediumvsQwen3 Coder Nextnone GPT-5.5lowvsQwen3.6 Max Previewmedium Claude Opus 4.8mediumvsGPT-5.5low Gemini 3.5 FlashhighvsGPT-5.5low