قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3 Coder Next

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-05

المقياس	OpenAI: GPT-5.4 none الإصدار: 2026-03-05	Qwen: Qwen3 Coder Next medium الإصدار: 2026-02-03
الترتيب	#44	#51
متوسط الدرجة	46	33
الاتساق	89	95
التكلفة لكل نتيجة	1.496	0.224
إجمالي التكلفة	$0.090	$0.007
زمن الاستجابة (المتوسط)	1.46s	13.77s
زمن الاستجابة (الحد الأقصى)	2.89s	81.80s
زمن الاستجابة (الإجمالي)	21.86s	123.93s
اختبارات صحيحة
معدل النجاح لكل محاولة	44.4%	24.4%
اختبارات غير مستقرة	2	1
رموز الإخراج	1,635	2,793
رموز الاستدلال	0	0

أفضل النماذج حسب الدرجة

زمن الاستجابة (المتوسط)

الدرجة مقابل التكلفة الإجمالية

متوسط الدرجة vs زمن الاستجابة (المتوسط)

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.4	100	73	11.1%	1		1.41s	388	0
Qwen: Qwen3 Coder Next	13	75	22.2%	1		15.28s	1,246	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.4	100	100	0.0%	0		2.89s	291	0
Qwen: Qwen3 Coder Next	100	100	0.0%	0		4.28s	317	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.4	99	100	100.0%	0		1.04s	222	0
Qwen: Qwen3 Coder Next	54	100	50.0%	0		81.80s	246	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.4	40	72	44.4%	1		1.07s	50	0
Qwen: Qwen3 Coder Next	40	100	33.3%	0		638ms	25	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.4	55	100	50.0%	0		1.07s	81	0
Qwen: Qwen3 Coder Next	45	100	0.0%	0		7.34s	63	0

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.4	40	98	33.3%	0		1.52s	357	0
Qwen: Qwen3 Coder Next	100	100	0.0%	0		2.30s	641	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.4	100	100	100.0%	0		2.75s	246	0
Qwen: Qwen3 Coder Next	100	100	100.0%	0		2.64s	255	0

مقارنة سريعة

تبديل زوج المقارنة

Mercury 2nonevsQwen3 Coder Nextmedium MiniMax M2.5mediumvsGPT-5.4none Qwen3 Coder NextmediumvsGrok 4.1 Fastnone Kimi K2.5nonevsQwen3 Coder Nextmedium Qwen3 Coder NextmediumvsMiMo-V2-Flashnone Qwen3 Coder NextmediumvsGLM 4.7 Flashnone LFM2-24B-A2BnonevsQwen3 Coder Nextmedium GPT-4o-mininonevsQwen3 Coder Nextmedium Mercury 2mediumvsGPT-5.4none Trinity Large Preview (free)noneمتاح مجانًاvsQwen3 Coder Nextmedium GPT-5.4nonevsQwen3.5-35B-A3Bmedium GPT-5.4nonevsGLM 4.7 Flashmedium