AI BENCHY Compare

Qwen: Qwen3 Coder Next vs xAI: Grok 4.20

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-29

المقياس	Qwen3 Coder Next Qwen3 Coder Next none الإصدار: 2026-02-03	Grok 4.20 Grok 4.20 none الإصدار: 2026-03-31

المقياس	Qwen3 Coder Next Qwen3 Coder Next none الإصدار: 2026-02-03	Grok 4.20 Grok 4.20 none الإصدار: 2026-03-31
النتيجة	5.1	5.2
الترتيب	#113	#108
الموثوقية	غير متاح	غير متاح
الاتساق	9.7	9.5
اختبارات صحيحة
معدل النجاح لكل محاولة	25.9%	29.6%
اختبارات غير مستقرة	1	1
إجمالي مرات التشغيل	54	54
التكلفة لكل نتيجة	0.188	1.889
إجمالي التكلفة	$0.008	$0.095
??? ???????	$0.140 / 1M	$2.000 / 1M
??? ???????	$0.800 / 1M	$6.000 / 1M
رموز الإخراج	3,617	1,967
رموز الاستدلال	0	0
زمن الاستجابة (المتوسط)	10.18s	1.11s
زمن الاستجابة (الحد الأقصى)	45.14s	6.04s
زمن الاستجابة (الإجمالي)	122.13s	20.02s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3 Coder Next	3.6	10.0	0.0%	0		3.31s	1,321	0
Grok 4.20	4.8	10.0	25.0%	0		501ms	267	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3 Coder Next	7.3	3.7	66.7%	1		3.14s	585	0
Grok 4.20	3.4	9.3	0.0%	0		1.22s	312	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3 Coder Next	3.0	10.0	0.0%	0		45.14s	317	0
Grok 4.20	3.0	10.0	0.0%	0		6.04s	282	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3 Coder Next	6.5	10.0	50.0%	0		1.32s	246	0
Grok 4.20	10.0	10.0	100.0%	0		522ms	207	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3 Coder Next	5.3	10.0	33.3%	0		962ms	26	0
Grok 4.20	3.0	10.0	0.0%	0		687ms	325	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	152	0
Grok 4.20	4.8	10.0	0.0%	0		659ms	83	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3 Coder Next	4.8	10.0	0.0%	0		7.71s	63	0
Grok 4.20	4.8	10.0	0.0%	0		455ms	60	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3 Coder Next	3.2	10.0	0.0%	0		22.86s	652	0
Grok 4.20	5.3	7.4	44.4%	1		487ms	242	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	255	0
Grok 4.20	10.0	10.0	100.0%	0		4.63s	189	0

مقارنة سريعة

تبديل زوج المقارنة

Nemotron 3 Nano Omni 30b A3b Reasoningmediumمتاح مجانًاvsGrok 4.20none Elephant AlphamediumvsGrok 4.20none MiniMax M2.7mediumvsGrok 4.20none Nemotron 3 Nano Omni 30b A3b Reasoningmediumمتاح مجانًاvsQwen3 Coder Nextnone Elephant AlphamediumvsQwen3 Coder Nextnone MiniMax M2.7mediumvsQwen3 Coder Nextnone Mistral Small 4mediumvsGrok 4.20none MiniMax M2.5mediumمتاح مجانًاvsGrok 4.20none Qwen3 Coder NextmediumvsGrok 4.20none Qwen3 Coder NextnonevsGLM 4.7 Flashmedium Mistral Small 4mediumvsQwen3 Coder Nextnone MiniMax M2.5mediumمتاح مجانًاvsQwen3 Coder Nextnone