التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs OpenAI: GPT-5.4 Mini

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-01

المقياس Gemini 3 Flash Preview Gemini 3 Flash Preview medium الإصدار: 2025-12-17 GPT-5.4 Mini GPT-5.4 Mini none الإصدار: 2026-03-17
النتيجة 10.0 5.1
الترتيب #1 #117
الموثوقية غير متاح غير متاح
الاتساق 10.0 8.6
اختبارات صحيحة
معدل النجاح لكل محاولة 100.0% 35.2%
اختبارات غير مستقرة 0 3
إجمالي مرات التشغيل 18 54
التكلفة لكل نتيجة 0.600 0.630
إجمالي التكلفة $0.108 $0.032
??? ??????? $0.500 / 1M $0.750 / 1M
??? ??????? $3.000 / 1M $4.500 / 1M
رموز الإخراج 655 2,418
رموز الاستدلال 33,749 0
زمن الاستجابة (المتوسط) 12.11s 1.17s
زمن الاستجابة (الحد الأقصى) 82.37s 2.52s
زمن الاستجابة (الإجمالي) 217.93s 21.01s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.26s 110 1,076
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 82.37s 144 16,257
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.19s 333 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 23.58s 117 3,495
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 7.62s 93 2,197
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 14.81s 4 7,228
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.34s 24 635
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.30s 24 903
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.86s 61 1,455
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.78s 78 503
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0

مقارنة سريعة

تبديل زوج المقارنة