Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.3 Chat

يتقدم GPT-5.3 Chat في متوسط النتيجة بـ 7.5 مقابل 7.3. لدى Gemini 3.1 Flash Lite Preview (medium) تكلفة benchmark أقل عند $0.115 مقابل $0.571. Gemini 3.1 Flash Lite Preview (medium) أسرع عند 4.61s مقابل 6.88s، مع معدلات نجاح 59.1% مقابل 68.2%.

النموذج الموصى بهGemini 3.1 Flash Lite Preview (medium)Its score stays close to the best score here (7.3 vs 7.5), while costing about 5.0x less than GPT-5.3 Chat.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-17

المقياس	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium الإصدار: 2026-03-03	GPT-5.3 Chat GPT-5.3 Chat none الإصدار: 2026-03-03

المقياس	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium الإصدار: 2026-03-03	GPT-5.3 Chat GPT-5.3 Chat none الإصدار: 2026-03-03
النتيجة	7.3	7.5
الترتيب	#61	#52
الموثوقية	10.0	10.0
الاتساق	9.9	8.2
اختبارات صحيحة
معدل النجاح لكل محاولة	59.1%	68.2%
اختبارات غير مستقرة	0	5
إجمالي مرات التشغيل	66	66
التكلفة لكل نتيجة	0.884	4.387
إجمالي التكلفة	$0.115	$0.571
سعر الإدخال	$0.250 / 1M	$1.750 / 1M
سعر الإخراج	$1.500 / 1M	$14.000 / 1M
إجمالي رموز الإدخال	117,480	78,990
رموز الإخراج	10,589	30,854
رموز الاستدلال	46,394	0
زمن الاستجابة (المتوسط)	4.61s	6.88s
زمن الاستجابة (الحد الأقصى)	18.34s	18.33s
زمن الاستجابة (الإجمالي)	101.39s	151.31s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#61 Gemini 3.1 Flash Lite Preview

medium

التكلفة: $0.003
الوقت: 5.2s
الرموز: 1,944 tok

#52 GPT-5.3 Chat

none

التكلفة: $0.008
الوقت: 8.1s
الرموز: 634 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

الفئة:

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite Preview	9.1	10.0	75.0%	0		2.33s	512	570	4,305
GPT-5.3 Chat	6.7	8.1	58.3%	1		3.86s	606	3,167	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		4.09s	8,126	461	8,597
GPT-5.3 Chat	5.6	4.7	55.6%	2		10.52s	7,302	6,632	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite Preview	7.2	9.1	50.0%	0		16.63s	93,097	8,706	16,997
GPT-5.3 Chat	10.0	10.0	100.0%	0		15.07s	55,800	6,851	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		2.29s	7,362	279	2,952
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.21s	7,140	942	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		4.21s	639	18	5,325
GPT-5.3 Chat	3.5	4.4	33.3%	2		13.01s	723	8,264	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.16s	488	96	1,488
GPT-5.3 Chat	4.6	10.0	0.0%	0		1.99s	477	319	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.91s	621	72	2,121
GPT-5.3 Chat	9.8	10.0	100.0%	0		3.51s	660	1,491	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite Preview	7.7	10.0	66.7%	0		5.30s	566	141	1,896
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.99s	642	1,758	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.80s	5,909	234	912
GPT-5.3 Chat	10.0	10.0	100.0%	0		8.36s	5,445	861	0

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		2.68s	160	12	1,801
GPT-5.3 Chat	3.0	10.0	0.0%	0		4.38s	195	569	0

مقارنة سريعة

تبديل زوج المقارنة

Kimi K2.7 CodemediumvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.5 Plus 2026-02-15medium Claude Sonnet 4.6nonevsGemini 3.1 Flash Lite Previewmedium Nemotron 3 Ultramediumمتاح مجانًاvsGPT-5.3 Chatnone Claude Opus 4.8nonevsGemini 3.1 Flash Lite Previewmedium Gemini 3.1 Flash Lite PreviewmediumvsKAT-Coder-Pro V2.5low Gemini 3.1 Flash Lite PreviewmediumvsStep 3.7 Flashlow GPT-5.3 ChatnonevsQwen3.5-27Bmedium GPT-5.3 ChatnonevsGrok Build 0.1medium Gemini 3.1 Flash Lite PreviewmediumvsKAT-Coder-Pro V2.5high MiniMax M3mediumvsGPT-5.3 Chatnone Gemini 3.1 Flash Lite PreviewmediumvsQwen3.7 Maxnone