AI BENCHY
قارن
❤️ Made by XCS

اسم النموذج

Google: Gemini 3 Flash Preview

تم إنشاء نتائج المعايير من مجموعات اختبارات Aibenchy في : 19‏/02‏/2026

المقياس Google: Gemini 3 Flash Preview
الترتيب#10
الشركةGoogle
Score 6.25
الاتساق 8.60
التكلفة لكل نتيجة 0.0754
إجمالي التكلفة $0.00528
اختبارات صحيحة 7/12
معدل النجاح لكل محاولة 66.7%
اختبارات غير مستقرة 2
رموز الإخراج 485
رموز الاستدلال 0

تفصيل الفئات

الفئة اختبارات ناجحة بالكامل Score الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة درجة الاستدلال التكلفة
Anti-AI Tricks 1/2 5.50 10.00 50.0% 0 - $0.00016
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 - $0.00357
Domain specific 2/3 7.00 10.00 66.7% 0 - $0.00038
Instructions following 1/2 5.50 5.81 66.7% 1 - $0.00054
Puzzle Solving 2/3 7.00 10.00 66.7% 0 - $0.00066

النماذج المقارنة

قارن Google: Gemini 3 Flash Preview مع...

#9 · MoonshotAI

MoonshotAI: Kimi K2.5

الاستدلال (medium)

Score: 6.42

الاتساق: 8.00

معدل النجاح لكل محاولة: 72.2%

اختبارات غير مستقرة: 3

التكلفة لكل نتيجة: 2.4097

اختبارات صحيحة: 7/12

إجمالي التكلفة: $0.16868

قارن

#11 · OpenAI

OpenAI: GPT-5 Nano

الاستدلال (medium)

Score: 5.92

الاتساق: 6.03

معدل النجاح لكل محاولة: 72.2%

اختبارات غير مستقرة: 6

التكلفة لكل نتيجة: 0.4675

اختبارات صحيحة: 6/12

إجمالي التكلفة: $0.02806

قارن

#8 · X Ai

xAI: Grok 4.1 Fast

الاستدلال (medium)

Score: 6.42

الاتساق: 8.60

معدل النجاح لكل محاولة: 66.7%

اختبارات غير مستقرة: 2

التكلفة لكل نتيجة: 0.4800

اختبارات صحيحة: 7/12

إجمالي التكلفة: $0.03360

قارن

مقارنة سريعة

قارن Google: Gemini 3 Flash Preview مع...