قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5 Mini

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس	Google: Gemini 3.1 Flash Lite Preview none الإصدار: 2026-03-03	OpenAI: GPT-5 Mini medium الإصدار: 2025-08-07
الترتيب	#10	#33
متوسط الدرجة	7.70	5.77
الاتساق	9.54	8.79
التكلفة لكل نتيجة	0.116	1.200
إجمالي التكلفة	$0.011	$0.084
اختبارات صحيحة
معدل النجاح لكل محاولة	69.1%	57.1%
اختبارات غير مستقرة	1	2
رموز الإخراج	4,307	4,723
رموز الاستدلال	0	35,392

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	6.00	7.85	55.6%	1		1,086	0
OpenAI: GPT-5 Mini	7.00	9.62	66.7%	0		1,645	5,824

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	9.88	10.00	100.0%	0		399	0
OpenAI: GPT-5 Mini	9.88	10.00	100.0%	0		453	3,200

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	4.00	10.00	33.3%	0		568	0
OpenAI: GPT-5 Mini	1.00	7.21	22.2%	1		293	14,016

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	9.00	10.00	50.0%	0		574	0
OpenAI: GPT-5 Mini	7.00	6.64	66.7%	1		318	4,992

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		898	0
OpenAI: GPT-5 Mini	4.33	9.78	33.3%	0		1,527	5,760

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		782	0
OpenAI: GPT-5 Mini	10.00	10.00	100.0%	0		487	1,600

مقارنة سريعة

تبديل زوج المقارنة

Gemini 3.1 Flash Lite PreviewnonevsGPT-5.3-Codexmedium Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewnone GPT-5 MinimediumvsGLM 5none Gemini 3.1 Flash Lite PreviewnonevsGLM 5medium Gemini 2.5 FlashnonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none GPT-5 MinimediumvsQwen3.5-122B-A10Bnone Claude Sonnet 4.6nonevsGPT-5 Minimedium Gemini 3.1 Flash Lite PreviewnonevsStep 3.5 Flashmediumمتاح مجانًا DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5.2medium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-27Bmedium