قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-5 Mini vs Qwen: Qwen3 Coder Next

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-05

المقياس	OpenAI: GPT-5 Mini medium الإصدار: 2025-08-07	Qwen: Qwen3 Coder Next none الإصدار: 2026-02-03
الترتيب	#31	#49
متوسط الدرجة	6.1	3.6
اختبارات صحيحة
الاتساق	8.9	10.0
التكلفة لكل نتيجة	1.401	0.226
إجمالي التكلفة	$0.113	$0.007
معدل النجاح لكل محاولة	62.2%	20.0%
اختبارات غير مستقرة	2	0
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
رموز الإخراج	5,477	2,874
رموز الاستدلال	46,912	0
زمن الاستجابة (المتوسط)	25.92s	12.82s
زمن الاستجابة (الحد الأقصى)	88.15s	45.14s
زمن الاستجابة (الإجمالي)	388.79s	115.42s

أفضل النماذج حسب الدرجة

زمن الاستجابة (المتوسط)

الدرجة مقابل التكلفة الإجمالية

متوسط الدرجة vs زمن الاستجابة (المتوسط)

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	7.0	9.6	66.7%	0		16.45s	1,645	5,824
Qwen: Qwen3 Coder Next	2.3	10.0	0.0%	0		4.39s	1,315	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	754	11,520
Qwen: Qwen3 Coder Next	10.0	10.0	0.0%	0		45.14s	317	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	9.9	10.0	100.0%	0		12.58s	453	3,200
Qwen: Qwen3 Coder Next	5.4	10.0	50.0%	0		1.32s	246	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	10.0	7.2	22.2%	1		44.63s	293	14,016
Qwen: Qwen3 Coder Next	4.0	10.0	33.3%	0		962ms	26	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	7.5	6.6	83.3%	1		15.66s	318	4,992
Qwen: Qwen3 Coder Next	4.5	10.0	0.0%	0		7.71s	63	0

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	4.3	9.8	33.3%	0		14.09s	1,527	5,760
Qwen: Qwen3 Coder Next	1.3	10.0	0.0%	0		22.86s	652	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	487	1,600
Qwen: Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	255	0

مقارنة سريعة

تبديل زوج المقارنة

GPT-5 MinimediumvsGLM 5none Qwen3 Coder NextnonevsGLM 4.7 Flashmedium GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none Claude Sonnet 4.6nonevsGPT-5 Minimedium Gemini 2.5 FlashnonevsGPT-5 Minimedium DeepSeek V3.2nonevsGPT-5 Minimedium Gemini 3 Flash PreviewnonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-122B-A10Bnone GPT-5 MinimediumvsQwen3.5-Flashnone GPT-5 MinimediumvsQwen3.5-27Bnone MiniMax M2.5mediumvsQwen3 Coder Nextnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5 Minimedium