AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs OpenAI: GPT-5 Mini

الملخص

مقارنة benchmark بين GPT-5.2 Chat و GPT-5 Mini: متوسط النتيجة متقارب جدًا عند 8.5 مقابل 8.5. لدى GPT-5 Mini تكلفة benchmark أقل عند $0.159 مقابل $0.393. GPT-5.2 Chat أسرع عند 7.13s مقابل 23.64s، مع معدلات نجاح 74.6% مقابل 63.5%.

النموذج الموصى به: GPT-5 Mini - It has the best score here (8.5), while costing about 2.5x less than GPT-5.2 Chat.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس	GPT-5.2 Chat GPT-5.2 Chat none الإصدار: 2025-12-11	GPT-5 Mini GPT-5 Mini medium الإصدار: 2025-08-07

المقياس	GPT-5.2 Chat GPT-5.2 Chat none الإصدار: 2025-12-11	GPT-5 Mini GPT-5 Mini medium الإصدار: 2025-08-07
النتيجة	8.5	8.5
الترتيب	#19	#16
الموثوقية	10.0	10.0
الاتساق	8.9	9.1
اختبارات صحيحة
معدل النجاح لكل محاولة	74.6%	63.5%
اختبارات غير مستقرة	3	2
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	2.803	1.319
إجمالي التكلفة	$0.393	$0.159
سعر الإدخال	$1.750 / 1M	$0.250 / 1M
سعر الإخراج	$14.000 / 1M	$2.000 / 1M
إجمالي رموز الإدخال	34,212	37,100
رموز الإخراج	23,744	6,801
رموز الاستدلال	0	67,690
زمن الاستجابة (المتوسط)	7.13s	23.64s
زمن الاستجابة (الحد الأقصى)	38.52s	88.15s
زمن الاستجابة (الإجمالي)	149.69s	496.44s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#19 GPT-5.2 Chat

none

التكلفة: $0.010
الوقت: 15.3s
الرموز: 797 tok

#16 GPT-5 Mini

medium

التكلفة: $0.007
الوقت: 42.9s
الرموز: 3,432 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	8.7	7.9	91.7%	1		3.40s	606	1,807	0
GPT-5 Mini	7.1	7.6	66.7%	1		13.86s	606	1,715	6,378

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	8.8	7.8	88.9%	1		9.82s	7,305	6,731	0
GPT-5 Mini	10.0	10.0	100.0%	0		27.63s	7,302	658	17,152

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	10.0	10.0	100.0%	0		9.12s	11,019	1,243	0
GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	14,118	754	11,520

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	10.0	10.0	100.0%	0		3.05s	7,140	980	0
GPT-5 Mini	10.0	10.0	100.0%	0		12.58s	7,140	453	3,200

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	5.3	10.0	33.3%	0		17.78s	723	7,810	0
GPT-5 Mini	3.6	7.2	22.2%	1		44.63s	515	293	14,016

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	4.4	3.0	33.3%	1		3.20s	477	335	0
GPT-5 Mini	4.5	10.0	0.0%	0		13.50s	477	349	1,856

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	9.8	10.0	100.0%	0		5.51s	660	1,441	0
GPT-5 Mini	10.0	10.0	100.0%	0		11.59s	660	310	3,968

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	7.7	10.0	66.7%	0		4.10s	642	1,603	0
GPT-5 Mini	5.6	9.8	33.3%	0		15.20s	642	1,622	6,144

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	10.0	10.0	100.0%	0		4.68s	5,445	555	0
GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	5,445	487	1,600

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.2 Chat	3.0	10.0	0.0%	0		6.89s	195	1,239	0
GPT-5 Mini	3.0	10.0	0.0%	0		9.99s	195	160	1,856

مقارنة سريعة

تبديل زوج المقارنة

Seed-2.0-LitemediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsStep 3.7 Flashmedium GPT-5.2 ChatnonevsGLM 5medium GPT-5.2 ChatnonevsGLM 5.2medium DeepSeek V4 FlashhighvsGPT-5.2 Chatnone Claude Opus 4.7mediumvsGPT-5.2 Chatnone Gemini 2.5 FlashmediumvsGPT-5.2 Chatnone DeepSeek V4 FlashhighvsGPT-5 Minimedium GPT-5.2 ChatnonevsQwen3.7 Plusmedium Claude Opus 4.8mediumvsGPT-5.2 Chatnone Nemotron 3 Ultra 550b A55bmediumمتاح مجانًاvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsQwen3.6 Max Previewmedium