قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs Qwen: Qwen3.5-27B

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس	OpenAI: GPT-5.2 Chat none الإصدار: 2025-12-11	Qwen: Qwen3.5-27B medium الإصدار: 2026-02-24
الترتيب	#12	#5
متوسط الدرجة	7.41	8.55
الاتساق	9.45	9.55
التكلفة لكل نتيجة	2.261	2.950
إجمالي التكلفة	$0.227	$0.325
اختبارات صحيحة
معدل النجاح لكل محاولة	73.8%	83.3%
اختبارات غير مستقرة	1	1
رموز الإخراج	14,267	1,091
رموز الاستدلال	0	131,807

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.2 Chat	10.00	10.00	100.0%	0		1,651	0
Qwen: Qwen3.5-27B	10.00	10.00	100.0%	0		102	8,956

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.2 Chat	9.88	10.00	100.0%	0		980	0
Qwen: Qwen3.5-27B	9.88	10.00	100.0%	0		270	16,150

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.2 Chat	4.00	10.00	33.3%	0		7,810	0
Qwen: Qwen3.5-27B	4.00	10.00	33.3%	0		43	52,368

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.2 Chat	5.50	6.13	66.7%	1		1,528	0
Qwen: Qwen3.5-27B	9.00	6.88	83.3%	1		97	11,638

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.2 Chat	7.00	10.00	66.7%	0		1,743	0
Qwen: Qwen3.5-27B	10.00	10.00	100.0%	0		231	41,372

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.2 Chat	10.00	10.00	100.0%	0		555	0
Qwen: Qwen3.5-27B	10.00	10.00	100.0%	0		348	1,323

مقارنة سريعة

تبديل زوج المقارنة

Claude Sonnet 4.6mediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsGLM 5medium Gemini 3 Flash PreviewlowvsQwen3.5-27Bmedium Gemini 2.5 FlashmediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewhighvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsStep 3.5 Flashmediumمتاح مجانًا Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2 Chatnone DeepSeek V3.2mediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsQwen3.5-122B-A10Bmedium Gemini 3.1 Flash Lite PreviewlowvsQwen3.5-27Bmedium Gemini 3.1 Flash Lite PreviewhighvsQwen3.5-27Bmedium