قارن الرسوم البيانية المنهجية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs OpenAI: GPT-5.4

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-06

المقياس	Google: Gemini 3 Flash Preview none الإصدار: 2025-12-17	OpenAI: GPT-5.4 medium الإصدار: 2026-03-05
الترتيب	#20	#9
متوسط الدرجة	7.2	8.0
الاتساق	9.0	8.5
التكلفة لكل نتيجة	0.169	6.601
إجمالي التكلفة	$0.019	$0.793
اختبارات صحيحة
معدل النجاح لكل محاولة	75.0%	83.3%
اختبارات غير مستقرة	2	3
إجمالي مرات التشغيل	48 (16 x 3)	48 (16 x 3)
رموز الإخراج	1,411	1,756
رموز الاستدلال	0	46,642
زمن الاستجابة (المتوسط)	1.75s	20.05s
زمن الاستجابة (الحد الأقصى)	3.56s	100.41s
زمن الاستجابة (الإجمالي)	15.71s	320.87s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

متوسط الدرجة vs زمن الاستجابة (المتوسط)

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Google: Gemini 3 Flash Preview	7.0	10.0	66.7%	0		1.59s	208	0
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		5.02s	216	1,466

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Google: Gemini 3 Flash Preview	10.0	1.6	66.7%	1		3.56s	350	0
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		20.57s	301	3,543

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Google: Gemini 3 Flash Preview	9.9	10.0	100.0%	0		1.41s	279	0
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		5.32s	234	804

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Google: Gemini 3 Flash Preview	7.0	10.0	66.7%	0		963ms	18	0
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		74.27s	61	34,748

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Google: Gemini 3 Flash Preview	10.0	10.0	100.0%	0		1.13s	104	0
OpenAI: GPT-5.4	5.0	3.1	33.3%	1		4.92s	145	321

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Google: Gemini 3 Flash Preview	5.5	5.8	66.7%	1		1.58s	74	0
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		3.11s	93	897

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Google: Gemini 3 Flash Preview	7.0	10.0	66.7%	0		1.06s	144	0
OpenAI: GPT-5.4	7.0	7.2	88.9%	1		9.13s	442	3,832

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Google: Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.35s	234	0
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		13.28s	264	1,031

مقارنة سريعة

تبديل زوج المقارنة

Gemini 3 Flash PreviewnonevsMiMo-V2-Flashmedium DeepSeek V3.2mediumvsGemini 3 Flash Previewnone Gemini 3.1 Flash Lite PreviewhighvsGPT-5.4medium Gemini 3 Flash PreviewlowvsGPT-5.4medium Gemini 3 Flash PreviewnonevsGLM 5medium Gemini 3 Flash PreviewnonevsStep 3.5 Flashmediumمتاح مجانًا Seed-2.0-MinimediumvsGemini 3 Flash Previewnone Gemini 3 Flash PreviewnonevsQwen3.5-Flashmedium Claude Sonnet 4.6mediumvsGemini 3 Flash Previewnone Gemini 3 Flash PreviewnonevsQwen3.5-122B-A10Bmedium Claude Opus 4.6mediumvsGemini 3 Flash Previewnone Gemini 3 Flash PreviewnonevsGPT-5.2medium