Google: Gemini 3.1 Pro Preview vs OpenAI: GPT-5.2 Chat

يتقدم Gemini 3.1 Pro Preview (medium) في متوسط النتيجة بـ 9.2 مقابل 8.0. لدى GPT-5.2 Chat تكلفة benchmark أقل عند $0.604 مقابل $1.361. GPT-5.2 Chat أسرع عند 7.65s مقابل 21.47s، مع معدلات نجاح 90.9% مقابل 74.2%.

النموذج الموصى بهGemini 3.1 Pro Preview (medium)It has the strongest score in this comparison (9.2) and the best overall balance of cost and response time across all 2 models.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-25

المقياس	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium الإصدار: 2026-02-19	GPT-5.2 Chat GPT-5.2 Chat none الإصدار: 2025-12-11

المقياس	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium الإصدار: 2026-02-19	GPT-5.2 Chat GPT-5.2 Chat none الإصدار: 2025-12-11
النتيجة	9.2	8.0
الترتيب	#10	#37
الموثوقية	10.0	10.0
الاتساق	10.0	8.6
اختبارات صحيحة
معدل النجاح لكل محاولة	90.9%	74.2%
اختبارات غير مستقرة	0	4
إجمالي مرات التشغيل	66	66
التكلفة لكل نتيجة	6.801	4.308
إجمالي التكلفة	$1.361	$0.604
سعر الإدخال	$2.000 / 1M	$1.750 / 1M
سعر الإخراج	$12.000 / 1M	$14.000 / 1M
إجمالي رموز الإدخال	92,287	101,248
رموز الإخراج	5,232	30,424
رموز الاستدلال	92,726	0
زمن الاستجابة (المتوسط)	21.47s	7.65s
زمن الاستجابة (الحد الأقصى)	88.68s	38.52s
زمن الاستجابة (الإجمالي)	322.08s	168.39s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#10 Gemini 3.1 Pro Preview

medium

التكلفة: $0.115
الوقت: 87.2s
الرموز: 9,629 tok

#37 GPT-5.2 Chat

none

التكلفة: $0.010
الوقت: 15.3s
الرموز: 797 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

الفئة:

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	498	112	3,218
GPT-5.2 Chat	8.7	7.9	91.7%	1		3.40s	606	1,807	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	7.9	9.9	66.7%	0		40.17s	8,124	435	41,247
GPT-5.2 Chat	8.8	7.8	88.9%	1		9.82s	7,305	6,731	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	9.8	10.0	100.0%	0		40.39s	67,910	3,687	23,111
GPT-5.2 Chat	7.3	5.8	83.3%	1		13.91s	78,055	7,923	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	7,265	279	3,904
GPT-5.2 Chat	10.0	10.0	100.0%	0		3.05s	7,140	980	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	635	18	12,424
GPT-5.2 Chat	5.3	10.0	33.3%	0		17.78s	723	7,810	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	490	108	1,179
GPT-5.2 Chat	4.4	3.0	33.3%	1		3.20s	477	335	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	621	72	2,236
GPT-5.2 Chat	9.8	10.0	100.0%	0		5.51s	660	1,441	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.90s	570	235	3,128
GPT-5.2 Chat	7.7	10.0	66.7%	0		4.10s	642	1,603	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	6,018	274	982
GPT-5.2 Chat	10.0	10.0	100.0%	0		4.68s	5,445	555	0

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.27s	156	12	1,297
GPT-5.2 Chat	3.0	10.0	0.0%	0		6.89s	195	1,239	0

مقارنة سريعة

تبديل زوج المقارنة

GPT-5.2 ChatnonevsStep 3.7 Flashmedium Claude Opus 5highvsGemini 3.1 Pro Previewmedium GPT-5.2 ChatnonevsInklinghigh Gemini 3.5 Flash-LitehighvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsGLM 5.2high Muse Spark 1.1highvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsInklingmedium Kimi K3maxvsGPT-5.2 Chatnone Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Gemini 3.1 Pro PreviewmediumvsGPT-5.6 Solhigh Seed-2.0-LitemediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsQwen3.7 Plusmedium