قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs OpenAI: GPT-5 Mini

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس	Google: Gemini 3.1 Pro Preview medium الإصدار: 2026-02-19	OpenAI: GPT-5 Mini medium الإصدار: 2025-08-07
الترتيب	#2	#33
متوسط الدرجة	9.36	5.77
الاتساق	10.00	8.79
التكلفة لكل نتيجة	2.443	1.200
إجمالي التكلفة	$0.318	$0.084
اختبارات صحيحة
معدل النجاح لكل محاولة	92.9%	57.1%
اختبارات غير مستقرة	0	2
رموز الإخراج	1,000	4,723
رموز الاستدلال	22,936	35,392

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		106	2,533
OpenAI: GPT-5 Mini	7.00	9.62	66.7%	0		1,645	5,824

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		292	3,164
OpenAI: GPT-5 Mini	9.88	10.00	100.0%	0		453	3,200

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Pro Preview	7.00	10.00	66.7%	0		18	10,688
OpenAI: GPT-5 Mini	1.00	7.21	22.2%	1		293	14,016

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		72	2,436
OpenAI: GPT-5 Mini	7.00	6.64	66.7%	1		318	4,992

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		238	3,133
OpenAI: GPT-5 Mini	4.33	9.78	33.3%	0		1,527	5,760

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		274	982
OpenAI: GPT-5 Mini	10.00	10.00	100.0%	0		487	1,600

مقارنة سريعة

تبديل زوج المقارنة

GPT-5 MinimediumvsGLM 5none Gemini 2.5 FlashnonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none GPT-5 MinimediumvsQwen3.5-122B-A10Bnone Claude Sonnet 4.6nonevsGPT-5 Minimedium DeepSeek V3.2nonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-27Bnone GPT-5 MinimediumvsQwen3.5-35B-A3Bnone Trinity Large Preview (free)noneمتاح مجانًاvsGPT-5 Minimedium Gemini 3 Flash PreviewnonevsGPT-5 Minimedium Kimi K2.5nonevsGPT-5 Minimedium Gemini 3.1 Flash Lite PreviewnonevsGPT-5 Minimedium