التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs OpenAI: GPT-5.4 Nano

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-17

المقياس Gemini 3 Flash Preview Gemini 3 Flash Preview low الإصدار: 2025-12-17 GPT-5.4 Nano GPT-5.4 Nano medium الإصدار: 2026-03-17
الترتيب #3 #28
النتيجة 8.7 7.4
الاتساق 9.5 9.0
التكلفة لكل نتيجة 0.577 0.769
إجمالي التكلفة $0.081 $0.077
اختبارات صحيحة
معدل النجاح لكل محاولة 84.3% 66.7%
اختبارات غير مستقرة 1 2
إجمالي مرات التشغيل 51 51
رموز الإخراج 1,592 2,474
رموز الاستدلال 20,556 54,516
زمن الاستجابة (المتوسط) 5.95s 11.08s
زمن الاستجابة (الحد الأقصى) 14.72s 94.06s
زمن الاستجابة (الإجمالي) 101.19s 188.39s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.48s 281 3,082
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 3.0 10.0 0.0% 0 3.27s 326 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.40s 279 3,656
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 5.3 7.2 44.4% 1 8.05s 12 6,410
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.68s 120 981
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 9.9 10.0 100.0% 0 7.02s 71 2,752
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.11s 269 3,260
GPT-5.4 Nano 4.0 7.1 22.2% 1 3.65s 640 1,356
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.99s 234 415
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382

مقارنة سريعة

تبديل زوج المقارنة