AI BENCHY Compare

OpenAI: GPT-5 Mini vs Qwen: Qwen3.5-9B

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-12

المقياس	GPT-5 Mini GPT-5 Mini medium الإصدار: 2025-08-07	Qwen3.5-9B Qwen3.5-9B none الإصدار: 2026-03-02

المقياس	GPT-5 Mini GPT-5 Mini medium الإصدار: 2025-08-07	Qwen3.5-9B Qwen3.5-9B none الإصدار: 2026-03-02
الترتيب	#34	#60
متوسط الدرجة	6.0	3.4
الاتساق	8.9	10.0
التكلفة لكل نتيجة	1.457	0.111
إجمالي التكلفة	$0.117	$0.005
اختبارات صحيحة
معدل النجاح لكل محاولة	58.3%	25.0%
اختبارات غير مستقرة	2	0
إجمالي مرات التشغيل	48	48
رموز الإخراج	5,826	2,939
رموز الاستدلال	48,768	0
زمن الاستجابة (المتوسط)	25.14s	1.06s
زمن الاستجابة (الحد الأقصى)	88.15s	5.91s
زمن الاستجابة (الإجمالي)	402.29s	16.95s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

متوسط الدرجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

متوسط الدرجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	7.0	9.6	66.7%	0		16.45s	1,645	5,824
Qwen3.5-9B	10.0	9.9	0.0%	0		1.02s	576	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	754	11,520
Qwen3.5-9B	10.0	10.0	0.0%	0		5.91s	1,255	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	9.9	10.0	100.0%	0		12.58s	453	3,200
Qwen3.5-9B	9.9	10.0	100.0%	0		847ms	249	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	10.0	7.2	22.2%	1		44.63s	293	14,016
Qwen3.5-9B	10.0	10.0	0.0%	0		464ms	24	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	4.0	10.0	0.0%	0		13.50s	349	1,856
Qwen3.5-9B	3.0	9.9	0.0%	0		552ms	99	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	7.5	6.6	83.3%	1		15.66s	318	4,992
Qwen3.5-9B	5.5	10.0	50.0%	0		514ms	75	0

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	4.3	9.8	33.3%	0		14.09s	1,527	5,760
Qwen3.5-9B	10.0	9.9	0.0%	0		683ms	388	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	487	1,600
Qwen3.5-9B	10.0	10.0	100.0%	0		1.27s	273	0

مقارنة سريعة

تبديل زوج المقارنة

GPT-5 MinimediumvsGLM 5none GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none Qwen3.5-9BnonevsGLM 4.7 Flashmedium DeepSeek V3.2nonevsGPT-5 Minimedium Claude Sonnet 4.6nonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-Flashnone Gemini 2.5 FlashnonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-122B-A10Bnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5 Minimedium Seed-2.0-LitenonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-27Bnone Gemini 3 Flash PreviewnonevsGPT-5 Minimedium