AI BENCHY
قارن
❤️ Made by XCS

اسم النموذج

OpenAI: gpt-oss-120b

تم إنشاء نتائج المعايير من مجموعات اختبارات Aibenchy في : 19‏/02‏/2026

المقياس OpenAI: gpt-oss-120b
الترتيب#12
الشركةOpenAI
Score 5.75
الاتساق 7.19
التكلفة لكل نتيجة 0.0951
إجمالي التكلفة $0.00571
اختبارات صحيحة 6/12
معدل النجاح لكل محاولة 63.9%
اختبارات غير مستقرة 4
رموز الإخراج 8,060
رموز الاستدلال 23,792

تفصيل الفئات

الفئة اختبارات ناجحة بالكامل Score الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة درجة الاستدلال التكلفة
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 10.00 $0.00029
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 10.00 $0.00052
Domain specific 0/3 1.00 4.41 22.2% 2 8.53 $0.00393
Instructions following 2/2 10.00 10.00 100.0% 0 9.50 $0.00040
Puzzle Solving 1/3 5.00 7.13 44.4% 1 7.89 $0.00059

النماذج المقارنة

قارن OpenAI: gpt-oss-120b مع...

#11 · OpenAI

OpenAI: GPT-5 Nano

الاستدلال (medium)

Score: 5.92

الاتساق: 6.03

معدل النجاح لكل محاولة: 72.2%

اختبارات غير مستقرة: 6

التكلفة لكل نتيجة: 0.4675

اختبارات صحيحة: 6/12

إجمالي التكلفة: $0.02806

قارن

#13 · Anthropic

Anthropic: Claude Sonnet 4.6

بدون استدلال

Score: 5.75

الاتساق: 9.42

معدل النجاح لكل محاولة: 52.8%

اختبارات غير مستقرة: 1

التكلفة لكل نتيجة: 0.9480

اختبارات صحيحة: 6/12

إجمالي التكلفة: $0.05688

قارن

#10 · Google

Google: Gemini 3 Flash Preview

بدون استدلال

Score: 6.25

الاتساق: 8.60

معدل النجاح لكل محاولة: 66.7%

اختبارات غير مستقرة: 2

التكلفة لكل نتيجة: 0.0754

اختبارات صحيحة: 7/12

إجمالي التكلفة: $0.00528

قارن

مقارنة سريعة

قارن OpenAI: gpt-oss-120b مع...