AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs OpenAI: GPT-5.3 Chat

الملخص

مقارنة benchmark بين Gemini 3.1 Flash Lite و GPT-5.3 Chat: يتقدم Gemini 3.1 Flash Lite في متوسط النتيجة بـ 7.8 مقابل 7.5. لدى Gemini 3.1 Flash Lite تكلفة benchmark أقل عند $0.071 مقابل $0.433. Gemini 3.1 Flash Lite أسرع عند 3.23s مقابل 6.34s، مع معدلات نجاح 65.1% مقابل 66.7%.

النموذج الموصى به: Gemini 3.1 Flash Lite - It has the best score here (7.8), while costing about 6.2x less than GPT-5.3 Chat.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium الإصدار: 2026-05-08	GPT-5.3 Chat GPT-5.3 Chat none الإصدار: 2026-03-03

المقياس	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium الإصدار: 2026-05-08	GPT-5.3 Chat GPT-5.3 Chat none الإصدار: 2026-03-03
النتيجة	7.8	7.5
الترتيب	#34	#45
الموثوقية	10.0	10.0
الاتساق	9.2	8.1
اختبارات صحيحة
معدل النجاح لكل محاولة	65.1%	66.7%
اختبارات غير مستقرة	2	5
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	0.539	3.605
إجمالي التكلفة	$0.071	$0.433
سعر الإدخال	$0.250 / 1M	$1.750 / 1M
سعر الإخراج	$1.500 / 1M	$14.000 / 1M
إجمالي رموز الإدخال	36,808	34,209
رموز الإخراج	2,254	26,617
رموز الاستدلال	38,300	0
زمن الاستجابة (المتوسط)	3.23s	6.34s
زمن الاستجابة (الحد الأقصى)	10.87s	18.33s
زمن الاستجابة (الإجمالي)	67.80s	133.13s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#34 Gemini 3.1 Flash Lite

medium

التكلفة: $0.003
الوقت: 5.3s
الرموز: 1,754 tok

#45 GPT-5.3 Chat

none

التكلفة: $0.008
الوقت: 8.1s
الرموز: 634 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite	9.1	10.0	75.0%	0		2.39s	502	604	4,201
GPT-5.3 Chat	6.7	8.1	58.3%	1		3.86s	606	3,167	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite	5.5	10.0	33.3%	0		3.81s	8,134	459	8,978
GPT-5.3 Chat	5.6	4.7	55.6%	2		10.52s	7,302	6,632	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		10.87s	12,873	327	7,401
GPT-5.3 Chat	10.0	10.0	100.0%	0		11.96s	11,019	2,614	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.60s	7,362	279	2,845
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.21s	7,140	942	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		3.16s	643	15	5,165
GPT-5.3 Chat	3.5	4.4	33.3%	2		13.01s	723	8,264	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.60s	488	84	1,142
GPT-5.3 Chat	4.6	10.0	0.0%	0		1.99s	477	319	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite	9.9	10.0	100.0%	0		2.59s	623	75	3,320
GPT-5.3 Chat	9.8	10.0	100.0%	0		3.51s	660	1,491	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite	7.6	7.2	77.8%	1		1.95s	568	165	2,450
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.99s	642	1,758	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		4.55s	5,457	234	921
GPT-5.3 Chat	10.0	10.0	100.0%	0		8.36s	5,445	861	0

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		3.08s	158	12	1,877
GPT-5.3 Chat	3.0	10.0	0.0%	0		4.38s	195	569	0

مقارنة سريعة

تبديل زوج المقارنة

Mercury 2mediumvsGPT-5.3 Chatnone Kimi K2.5mediumvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.6 Flashmedium DeepSeek V3.2mediumvsGPT-5.3 Chatnone Gemini 3.1 Flash LitemediumvsStep 3.7 Flashlow GPT-5.3 ChatnonevsGrok Build 0.1medium DeepSeek V4 ProhighvsGPT-5.3 Chatnone Seed-2.0-MinimediumvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsMiMo-V2.5-Promedium MiniMax M3mediumvsGPT-5.3 Chatnone Gemini 3 Flash PreviewlowvsGPT-5.3 Chatnone DeepSeek V4 ProhighvsGemini 3.1 Flash Litemedium