قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs xAI: Grok 4.1 Fast

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس	OpenAI: GPT-5.2 Chat none الإصدار: 2025-12-11	xAI: Grok 4.1 Fast medium الإصدار: 2025-11-19
الترتيب	#12	#24
متوسط الدرجة	7.41	6.29
الاتساق	9.45	8.20
التكلفة لكل نتيجة	2.261	0.532
إجمالي التكلفة	$0.227	$0.043
اختبارات صحيحة
معدل النجاح لكل محاولة	73.8%	66.7%
اختبارات غير مستقرة	1	3
رموز الإخراج	14,267	793
رموز الاستدلال	0	74,056

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.2 Chat	10.00	10.00	100.0%	0		1,651	0
xAI: Grok 4.1 Fast	10.00	10.00	100.0%	0		102	4,021

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.2 Chat	9.88	10.00	100.0%	0		980	0
xAI: Grok 4.1 Fast	10.00	10.00	100.0%	0		180	5,472

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.2 Chat	4.00	10.00	33.3%	0		7,810	0
xAI: Grok 4.1 Fast	4.00	7.21	55.6%	1		12	40,547

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.2 Chat	5.50	6.13	66.7%	1		1,528	0
xAI: Grok 4.1 Fast	5.50	10.00	50.0%	0		48	3,151

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.2 Chat	7.00	10.00	66.7%	0		1,743	0
xAI: Grok 4.1 Fast	4.67	7.20	44.4%	1		191	9,380

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5.2 Chat	10.00	10.00	100.0%	0		555	0
xAI: Grok 4.1 Fast	1.00	1.62	33.3%	1		260	11,485

مقارنة سريعة

تبديل زوج المقارنة

Qwen3.5 Plus 2026-02-15nonevsGrok 4.1 Fastmedium Claude Sonnet 4.6mediumvsGPT-5.2 Chatnone Claude Sonnet 4.6nonevsGrok 4.1 Fastmedium GPT-5.2 ChatnonevsGLM 5medium Grok 4.1 FastmediumvsGLM 5none Gemini 2.5 FlashmediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewhighvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsStep 3.5 Flashmediumمتاح مجانًا Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2 Chatnone DeepSeek V3.2mediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsQwen3.5-122B-A10Bmedium