قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.2

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس	Google: Gemini 3.1 Flash Lite Preview low الإصدار: 2026-03-03	OpenAI: GPT-5.2 medium الإصدار: 2025-12-11
الترتيب	#8	#19
متوسط الدرجة	7.84	6.93
الاتساق	10.00	8.22
التكلفة لكل نتيجة	0.151	2.780
إجمالي التكلفة	$0.016	$0.251
اختبارات صحيحة
معدل النجاح لكل محاولة	71.4%	76.2%
اختبارات غير مستقرة	0	3
رموز الإخراج	1,317	1,869
رموز الاستدلال	6,126	14,190

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	7.00	10.00	66.7%	0		456	1,224
OpenAI: GPT-5.2	7.00	7.28	77.8%	1		549	2,002

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	9.88	10.00	100.0%	0		291	696
OpenAI: GPT-5.2	10.00	10.00	100.0%	0		234	499

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	4.00	10.00	33.3%	0		18	1,212
OpenAI: GPT-5.2	4.00	7.21	55.6%	1		42	9,690

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	8.50	10.00	50.0%	0		72	753
OpenAI: GPT-5.2	9.50	10.00	100.0%	0		95	587

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		243	1,248
OpenAI: GPT-5.2	8.00	10.00	66.7%	0		710	943

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		237	993
OpenAI: GPT-5.2	1.00	1.62	66.7%	1		239	469

مقارنة سريعة

تبديل زوج المقارنة

Gemini 3.1 Flash Lite PreviewlowvsGPT-5.3-Codexmedium Gemini 3 Flash PreviewnonevsGPT-5.2medium Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewlow Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewlowvsGLM 5medium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.3 Chatnone Claude Sonnet 4.6nonevsGPT-5.2medium GPT-5.2mediumvsQwen3.5 Plus 2026-02-15none Gemini 3.1 Flash Lite PreviewlowvsQwen3.5-27Bmedium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.2medium Gemini 3.1 Flash Lite PreviewlowvsQwen3.5 Plus 2026-02-15medium Gemini 3.1 Flash Lite PreviewlowvsStep 3.5 Flashmediumمتاح مجانًا