Google: Gemini 3.1 Pro Preview vs OpenAI: GPT-5.5

يتقدم Gemini 3.1 Pro Preview (medium) في متوسط النتيجة بـ 9.2 مقابل 9.0. لدى Gemini 3.1 Pro Preview (medium) تكلفة benchmark أقل عند $1.361 مقابل $4.137. Gemini 3.1 Pro Preview (medium) أسرع عند 21.47s مقابل 38.42s، مع معدلات نجاح 90.9% مقابل 87.9%.

النموذج الموصى بهGemini 3.1 Pro Preview (medium)It has the best score here (9.2), while costing about 3.0x less than GPT-5.5 (medium).

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-24

المقياس	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium الإصدار: 2026-02-19	GPT-5.5 GPT-5.5 medium الإصدار: 2026-04-24

المقياس	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium الإصدار: 2026-02-19	GPT-5.5 GPT-5.5 medium الإصدار: 2026-04-24
النتيجة	9.2	9.0
الترتيب	#10	#13
الموثوقية	10.0	10.0
الاتساق	10.0	8.9
اختبارات صحيحة
معدل النجاح لكل محاولة	90.9%	87.9%
اختبارات غير مستقرة	0	3
إجمالي مرات التشغيل	66	66
التكلفة لكل نتيجة	6.801	22.980
إجمالي التكلفة	$1.361	$4.137
سعر الإدخال	$2.000 / 1M	$5.000 / 1M
سعر الإخراج	$12.000 / 1M	$30.000 / 1M
إجمالي رموز الإدخال	92,287	80,659
رموز الإخراج	5,232	5,617
رموز الاستدلال	92,726	118,819
زمن الاستجابة (المتوسط)	21.47s	38.42s
زمن الاستجابة (الحد الأقصى)	88.68s	332.10s
زمن الاستجابة (الإجمالي)	322.08s	845.35s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#10 Gemini 3.1 Pro Preview

medium

التكلفة: $0.115
الوقت: 87.2s
الرموز: 9,629 tok

#13 GPT-5.5

medium

التكلفة: $0.112
الوقت: 71.9s
الرموز: 3,807 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

الفئة:

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	498	112	3,218
GPT-5.5	10.0	10.0	100.0%	0		4.66s	606	250	1,335

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	7.9	9.9	66.7%	0		40.17s	8,124	435	41,247
GPT-5.5	8.8	7.8	88.9%	1		59.77s	7,305	362	24,959

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	9.8	10.0	100.0%	0		40.39s	67,910	3,687	23,111
GPT-5.5	10.0	10.0	100.0%	0		33.52s	57,466	3,944	6,735

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	7,265	279	3,904
GPT-5.5	10.0	10.0	100.0%	0		4.18s	7,140	234	593

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	635	18	12,424
GPT-5.5	5.3	7.2	44.4%	1		164.14s	723	67	79,625

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	490	108	1,179
GPT-5.5	10.0	10.0	100.0%	0		4.16s	477	138	223

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	621	72	2,236
GPT-5.5	10.0	10.0	100.0%	0		3.36s	660	93	538

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.90s	570	235	3,128
GPT-5.5	10.0	10.0	100.0%	0		6.76s	642	241	2,225

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	6,018	274	982
GPT-5.5	10.0	10.0	100.0%	0		10.57s	5,445	258	832

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.27s	156	12	1,297
GPT-5.5	2.8	1.6	33.3%	1		37.86s	195	30	1,754

مقارنة سريعة

تبديل زوج المقارنة

Gemini 3.5 FlashlowvsGPT-5.5medium GPT-5.5mediumvsGrok 4.5high Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Gemini 3.1 Pro PreviewmediumvsGPT-5.6 Solhigh Gemini 3.1 Pro PreviewmediumvsGPT-5.6 Sollow Gemini 3.1 Pro PreviewmediumvsGrok 4.5high Gemini 3.6 FlashlowvsGPT-5.5medium Gemini 3.5 FlashhighvsGPT-5.5medium GPT-5.5mediumvsGrok 4.5low Gemini 3.6 FlashhighvsGPT-5.5medium Muse Spark 1.1lowvsGPT-5.5medium Gemini 3.1 Pro PreviewmediumvsGrok 4.5low