التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs OpenAI: GPT-5 Mini

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-28

المقياس Claude Opus 4.8 Claude Opus 4.8 none الإصدار: 2026-05-28 GPT-5 Mini GPT-5 Mini medium الإصدار: 2025-08-07
النتيجة 7.3 7.2
الترتيب #63 #70
الموثوقية 10.0 10.0
الاتساق 9.2 9.1
اختبارات صحيحة
معدل النجاح لكل محاولة 65.0% 61.7%
اختبارات غير مستقرة 2 2
إجمالي مرات التشغيل 60 60
التكلفة لكل نتيجة 4.324 1.348
إجمالي التكلفة $0.519 $0.149
سعر الإدخال $5.000 / 1M $0.250 / 1M
سعر الإخراج $25.000 / 1M $2.000 / 1M
رموز الإخراج 8,098 6,723
رموز الاستدلال 0 63,082
زمن الاستجابة (المتوسط) 3.51s 23.75s
زمن الاستجابة (الحد الأقصى) 17.73s 88.15s
زمن الاستجابة (الإجمالي) 70.19s 475.03s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
GPT-5 Mini 7.1 7.6 66.7% 1 13.86s 1,715 6,378
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
GPT-5 Mini 10.0 10.0 100.0% 0 30.74s 580 12,544
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
GPT-5 Mini 10.0 10.0 100.0% 0 88.15s 754 11,520
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
GPT-5 Mini 10.0 10.0 100.0% 0 12.58s 453 3,200
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
GPT-5 Mini 3.6 7.2 22.2% 1 44.63s 293 14,016
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
GPT-5 Mini 4.5 10.0 0.0% 0 13.50s 349 1,856
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
GPT-5 Mini 10.0 10.0 100.0% 0 11.59s 310 3,968
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
GPT-5 Mini 5.6 9.8 33.3% 0 15.20s 1,622 6,144
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
GPT-5 Mini 10.0 10.0 100.0% 0 18.64s 487 1,600
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
GPT-5 Mini 3.0 10.0 0.0% 0 9.99s 160 1,856

مقارنة سريعة

تبديل زوج المقارنة