قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs Qwen: Qwen3.5-122B-A10B

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس	OpenAI: GPT-5.2 Chat none الإصدار: 2025-12-11	Qwen: Qwen3.5-122B-A10B medium الإصدار: 2026-02-24
الترتيب	#12	#21
متوسط الدرجة	7.41	6.77
الاتساق	9.45	8.22
التكلفة لكل نتيجة	2.261	5.137
إجمالي التكلفة	$0.227	$0.463
اختبارات صحيحة
معدل النجاح لكل محاولة	73.8%	76.2%
اختبارات غير مستقرة	1	3
رموز الإخراج	14,267	16,751
رموز الاستدلال	0	125,394

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.2 Chat	10.00	10.00	100.0%	0		1,651	0
Qwen: Qwen3.5-122B-A10B	10.00	10.00	100.0%	0		248	10,486

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.2 Chat	9.88	10.00	100.0%	0		980	0
Qwen: Qwen3.5-122B-A10B	9.88	10.00	100.0%	0		270	16,558

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.2 Chat	4.00	10.00	33.3%	0		7,810	0
Qwen: Qwen3.5-122B-A10B	1.00	7.21	11.1%	1		15,537	64,889

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.2 Chat	5.50	6.13	66.7%	1		1,528	0
Qwen: Qwen3.5-122B-A10B	5.50	5.92	83.3%	1		77	7,372

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.2 Chat	7.00	10.00	66.7%	0		1,743	0
Qwen: Qwen3.5-122B-A10B	7.00	7.21	88.9%	1		297	24,863

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.2 Chat	10.00	10.00	100.0%	0		555	0
Qwen: Qwen3.5-122B-A10B	10.00	10.00	100.0%	0		322	1,226

مقارنة سريعة

تبديل زوج المقارنة

Claude Sonnet 4.6mediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsGLM 5medium Gemini 2.5 FlashmediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewhighvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsStep 3.5 Flashmediumمتاح مجانًا Claude Sonnet 4.6nonevsQwen3.5-122B-A10Bmedium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2 Chatnone DeepSeek V3.2mediumvsGPT-5.2 Chatnone Gemini 3 Flash PreviewnonevsQwen3.5-122B-A10Bmedium GPT-5.3 ChatnonevsQwen3.5-122B-A10Bmedium Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone Qwen3.5-122B-A10BmediumvsGLM 5none