AI BENCHY Compare

OpenAI: gpt-oss-120b vs Qwen: Qwen3.5 Plus 2026-02-15

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-29

المقياس	gpt-oss-120b gpt-oss-120b medium الإصدار: 2025-08-05 متاح مجانًا	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none الإصدار: 2026-02-15

المقياس	gpt-oss-120b gpt-oss-120b medium الإصدار: 2025-08-05 متاح مجانًا	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none الإصدار: 2026-02-15
النتيجة	5.9	6.4
الترتيب	#103	#94
الموثوقية	10.0	10.0
الاتساق	7.9	9.3
اختبارات صحيحة
معدل النجاح لكل محاولة	50.0%	48.3%
اختبارات غير مستقرة	5	2
إجمالي مرات التشغيل	60	60
التكلفة لكل نتيجة	0.151	0.195
إجمالي التكلفة	$0.013	$0.018
سعر الإدخال	$0.039 / 1M	$0.260 / 1M
سعر الإخراج	$0.180 / 1M	$1.560 / 1M
رموز الإخراج	17,495	2,474
رموز الاستدلال	46,878	0
زمن الاستجابة (المتوسط)	22.41s	2.40s
زمن الاستجابة (الحد الأقصى)	68.16s	6.65s
زمن الاستجابة (الإجمالي)	291.35s	33.56s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	6.7	9.9	50.0%	0		10.21s	3,518	2,177
Qwen3.5 Plus 2026-02-15	4.8	10.0	25.0%	0		1.91s	517	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	3.9	5.6	33.3%	1		47.24s	847	8,618
Qwen3.5 Plus 2026-02-15	4.9	6.9	16.7%	1		2.54s	467	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	10.0	10.0	100.0%	0		31.18s	694	5,072
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		6.65s	314	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	6.4	5.9	66.7%	1		1.98s	241	1,114
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		1.89s	243	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	2.9	4.4	22.2%	2		50.92s	6,784	20,606
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		1.17s	17	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	4.3	10.0	0.0%	0		7.90s	107	387
Qwen3.5 Plus 2026-02-15	4.4	3.0	33.3%	1		2.26s	117	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	9.9	10.0	100.0%	0		7.63s	126	1,799
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		1.67s	72	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	5.3	7.2	44.4%	1		21.71s	1,790	2,264
Qwen3.5 Plus 2026-02-15	7.7	10.0	66.7%	0		2.71s	494	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	9.8	10.0	100.0%	0		6.91s	287	1,083
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		3.33s	222	0

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
gpt-oss-120b	3.0	10.0	0.0%	0		26.51s	3,101	3,758
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		1.11s	11	0

مقارنة سريعة

تبديل زوج المقارنة

gpt-oss-120bmediumمتاح مجانًاvsQwen3.5-Flashnone gpt-oss-120bmediumمتاح مجانًاvsGLM 5V Turbonone Seed-2.0-Litenonevsgpt-oss-120bmediumمتاح مجانًا gpt-oss-120bmediumمتاح مجانًاvsGLM 5.1none Mercury 2mediumvsQwen3.5 Plus 2026-02-15none gpt-oss-120bmediumمتاح مجانًاvsQwen3.5 Plus 2026-04-20none gpt-oss-120bmediumمتاح مجانًاvsQwen3.5-35B-A3Bnone gpt-oss-120bmediumمتاح مجانًاvsQwen3.5-27Bnone gpt-oss-120bmediumمتاح مجانًاvsQwen3.6 27Bnone gpt-oss-120bmediumمتاح مجانًاvsMiMo-V2-Pronone gpt-oss-120bmediumمتاح مجانًاvsMiMo-V2-Omninone Gemma 4 26B A4Bnoneمتاح مجانًاvsgpt-oss-120bmediumمتاح مجانًا