قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.2

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس	Google: Gemini 3.1 Flash Lite Preview none الإصدار: 2026-03-03	OpenAI: GPT-5.2 medium الإصدار: 2025-12-11
الترتيب	#10	#19
متوسط الدرجة	7.70	6.93
الاتساق	9.54	8.22
التكلفة لكل نتيجة	0.116	2.780
إجمالي التكلفة	$0.011	$0.251
اختبارات صحيحة
معدل النجاح لكل محاولة	69.1%	76.2%
اختبارات غير مستقرة	1	3
رموز الإخراج	4,307	1,869
رموز الاستدلال	0	14,190

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	6.00	7.85	55.6%	1		1,086	0
OpenAI: GPT-5.2	7.00	7.28	77.8%	1		549	2,002

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	9.88	10.00	100.0%	0		399	0
OpenAI: GPT-5.2	10.00	10.00	100.0%	0		234	499

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	4.00	10.00	33.3%	0		568	0
OpenAI: GPT-5.2	4.00	7.21	55.6%	1		42	9,690

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	9.00	10.00	50.0%	0		574	0
OpenAI: GPT-5.2	9.50	10.00	100.0%	0		95	587

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		898	0
OpenAI: GPT-5.2	8.00	10.00	66.7%	0		710	943

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		782	0
OpenAI: GPT-5.2	1.00	1.62	66.7%	1		239	469

مقارنة سريعة

تبديل زوج المقارنة

Gemini 3.1 Flash Lite PreviewnonevsGPT-5.3-Codexmedium Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3 Flash PreviewnonevsGPT-5.2medium Gemini 3.1 Flash Lite PreviewnonevsGLM 5medium Claude Sonnet 4.6nonevsGPT-5.2medium GPT-5.2mediumvsQwen3.5 Plus 2026-02-15none Gemini 3.1 Flash Lite PreviewnonevsStep 3.5 Flashmediumمتاح مجانًا DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewhighvsGPT-5.2medium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-27Bmedium GPT-5.2mediumvsGLM 5none Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2medium