AI BENCHY Compare

OpenAI: gpt-oss-120b vs Qwen: Qwen3.5 Plus 2026-04-20

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-26

المقياس	gpt-oss-120b gpt-oss-120b none الإصدار: 2025-08-05 متاح مجانًا	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 none الإصدار: 2026-04-20

المقياس	gpt-oss-120b gpt-oss-120b none الإصدار: 2025-08-05 متاح مجانًا	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 none الإصدار: 2026-04-20
النتيجة	5.4	5.8
الترتيب	#119	#103
الموثوقية	10.0	9.9
الاتساق	9.1	8.5
اختبارات صحيحة
معدل النجاح لكل محاولة	38.6%	43.3%
اختبارات غير مستقرة	2	4
إجمالي مرات التشغيل	57	60
التكلفة لكل نتيجة	0.168	0.582
إجمالي التكلفة	$0.011	$0.041
??? ???????	$0.000 / 1M	$0.300 / 1M
??? ???????	$0.000 / 1M	$1.800 / 1M
رموز الإخراج	51,664	11,139
رموز الاستدلال	0	0
زمن الاستجابة (المتوسط)	21.61s	4.57s
زمن الاستجابة (الحد الأقصى)	113.71s	33.34s
زمن الاستجابة (الإجمالي)	345.79s	91.37s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	6.5	10.0	50.0%	0		32.84s	8,676	0
Qwen3.5 Plus 2026-04-20	4.8	10.0	25.0%	0		1.88s	557	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	4.3	1.1	66.7%	1		9.57s	3,232	0
Qwen3.5 Plus 2026-04-20	4.4	6.7	16.7%	1		2.08s	474	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0
Qwen3.5 Plus 2026-04-20	2.8	1.6	33.3%	1		13.32s	2,275	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	6.5	10.0	50.0%	0		7.12s	598	0
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		2.82s	243	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	3.0	10.0	0.0%	0		34.98s	29,483	0
Qwen3.5 Plus 2026-04-20	5.3	10.0	33.3%	0		4.43s	18	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	4.8	10.0	0.0%	0		10.79s	615	0
Qwen3.5 Plus 2026-04-20	4.8	10.0	0.0%	0		1.41s	119	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	9.8	10.0	100.0%	0		5.06s	1,940	0
Qwen3.5 Plus 2026-04-20	6.2	5.8	66.7%	1		1.17s	68	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	6.0	7.2	55.6%	1		8.21s	3,982	0
Qwen3.5 Plus 2026-04-20	6.7	7.9	55.6%	1		1.97s	583	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		4.42s	297	0

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	3.0	10.0	0.0%	0		47.29s	3,138	0
Qwen3.5 Plus 2026-04-20	3.0	10.0	0.0%	0		33.34s	6,505	0

مقارنة سريعة

تبديل زوج المقارنة

MiniMax M2.5mediumمتاح مجانًاvsgpt-oss-120bnoneمتاح مجانًا Owl AlphamediumvsQwen3.5 Plus 2026-04-20none Mistral Small 4mediumvsgpt-oss-120bnoneمتاح مجانًا gpt-oss-120bnoneمتاح مجانًاvsElephant Alphamedium MiniMax M2.7mediumvsgpt-oss-120bnoneمتاح مجانًا Cobuddymediumمتاح مجانًاvsQwen3.5 Plus 2026-04-20none gpt-oss-120bmediumمتاح مجانًاvsQwen3.5 Plus 2026-04-20none Nemotron 3 Supermediumمتاح مجانًاvsQwen3.5 Plus 2026-04-20none GPT-5 NanomediumvsQwen3.5 Plus 2026-04-20none Cobuddymediumمتاح مجانًاvsgpt-oss-120bnoneمتاح مجانًا MiniMax M2.5mediumمتاح مجانًاvsQwen3.5 Plus 2026-04-20none gpt-oss-120bnoneمتاح مجانًاvsOwl Alphamedium