AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs Qwen3.6 Plus Preview

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-22

المقياس	GPT-5.2 Chat GPT-5.2 Chat none الإصدار: 2025-12-11	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium الإصدار: 2026-04-20 متاح مجانًا

المقياس	GPT-5.2 Chat GPT-5.2 Chat none الإصدار: 2025-12-11	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium الإصدار: 2026-04-20 متاح مجانًا
النتيجة	7.6	8.2
الترتيب	#43	#16
الموثوقية	10.0	غير متاح
الاتساق	8.5	10.0
اختبارات صحيحة
معدل النجاح لكل محاولة	71.7%	75.0%
اختبارات غير مستقرة	4	0
إجمالي مرات التشغيل	60	57
التكلفة لكل نتيجة	2.955	0.000
إجمالي التكلفة	$0.355	$0.000
??? ???????	$1.750 / 1M	$0.000 / 1M
??? ???????	$14.000 / 1M	$0.000 / 1M
رموز الإخراج	21,371	1,153
رموز الاستدلال	0	62,197
زمن الاستجابة (المتوسط)	6.86s	15.25s
زمن الاستجابة (الحد الأقصى)	38.52s	43.55s
زمن الاستجابة (الإجمالي)	137.19s	182.96s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	8.7	7.9	91.7%	1		3.40s	1,807	0
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		11.69s	61	5,812

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	8.2	6.7	83.3%	1		8.05s	4,131	0
Qwen3.6 Plus Preview	0.0	0.0	0.0%	0		0ms	0	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	10.0	10.0	100.0%	0		9.12s	1,243	0
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		34.95s	452	13,073

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	10.0	10.0	100.0%	0		3.05s	980	0
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		14.95s	270	10,706

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	5.3	10.0	33.3%	0		17.78s	7,810	0
Qwen3.6 Plus Preview	3.0	10.0	0.0%	0		22.08s	49	26,895

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	4.4	3.0	33.3%	1		3.20s	335	0
Qwen3.6 Plus Preview	0.0	0.0	0.0%	0		0ms	0	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	7.3	5.9	83.3%	1		5.46s	1,528	0
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		3.40s	27	1,383

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	7.7	10.0	66.7%	0		4.42s	1,743	0
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		7.52s	27	2,998

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	10.0	10.0	100.0%	0		4.68s	555	0
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		5.87s	267	1,330

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	3.0	10.0	0.0%	0		6.89s	1,239	0
Qwen3.6 Plus Preview	0.0	0.0	0.0%	0		0ms	0	0

مقارنة سريعة

تبديل زوج المقارنة

GPT-5.2 ChatnonevsQwen3.5 Plus 2026-04-20medium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsMiMo-V2.5-Promedium GPT-5.2 ChatnonevsMiMo-V2-Promedium GPT-5.2 ChatnonevsGrok Build 0.1medium Claude Sonnet 4.6mediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsQwen3.5-122B-A10Bmedium Gemini 2.5 FlashmediumvsGPT-5.2 Chatnone Gemini 3.1 Flash LitemediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone Gemma 4 26B A4Bmediumمتاح مجانًاvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsQwen3.6 Plusmedium