AI BENCHY
قارن
❤️ Made by XCS

اسم النموذج

OpenAI: GPT-4o-mini

تم إنشاء نتائج المعايير من مجموعات اختبارات Aibenchy في : 19‏/02‏/2026

المقياس OpenAI: GPT-4o-mini
الترتيب#19
الشركةOpenAI
Score 4.00
الاتساق 9.98
التكلفة لكل نتيجة 0.0576
إجمالي التكلفة $0.00173
اختبارات صحيحة 3/12
معدل النجاح لكل محاولة 25.0%
اختبارات غير مستقرة 0
رموز الإخراج 570
رموز الاستدلال 0

تفصيل الفئات

الفئة اختبارات ناجحة بالكامل Score الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة درجة الاستدلال التكلفة
Anti-AI Tricks 0/2 1.00 10.00 0.0% 0 - $0.00005
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 - $0.00115
Domain specific 0/3 1.00 10.00 0.0% 0 - $0.00012
Instructions following 1/2 5.50 10.00 50.0% 0 - $0.00015
Puzzle Solving 0/3 4.00 9.92 0.0% 0 - $0.00028

النماذج المقارنة

قارن OpenAI: GPT-4o-mini مع...

#18 · Stepfun

StepFun: Step 3.5 Flash

الاستدلال (medium)

Score: 4.92

الاتساق: 7.34

معدل النجاح لكل محاولة: 58.3%

اختبارات غير مستقرة: 4

التكلفة لكل نتيجة: 0.0000

اختبارات صحيحة: 5/12

إجمالي التكلفة: $0.00000

قارن

#20 · Z.ai

Z.ai: GLM 4.7 Flash

الاستدلال (medium)

Score: 3.92

الاتساق: 6.51

معدل النجاح لكل محاولة: 50.0%

اختبارات غير مستقرة: 5

التكلفة لكل نتيجة: 0.2253

اختبارات صحيحة: 4/12

إجمالي التكلفة: $0.00902

قارن

#17 · MiniMax

MiniMax: MiniMax M2.5

الاستدلال (medium)

Score: 5.08

الاتساق: 6.00

معدل النجاح لكل محاولة: 61.1%

اختبارات غير مستقرة: 6

التكلفة لكل نتيجة: 4.0276

اختبارات صحيحة: 5/12

إجمالي التكلفة: $0.20138

قارن

مقارنة سريعة

قارن OpenAI: GPT-4o-mini مع...