التنقل
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.4 Mini

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-21

المقياس Claude Sonnet 4.6 Claude Sonnet 4.6 medium الإصدار: 2026-02-17 GPT-5.4 Mini GPT-5.4 Mini medium الإصدار: 2026-03-17
النتيجة 7.9 7.1
الترتيب #21 #36
الاتساق 9.5 7.2
اختبارات صحيحة
معدل النجاح لكل محاولة 72.6% 68.6%
اختبارات غير مستقرة 1 6
إجمالي مرات التشغيل 51 51
التكلفة لكل نتيجة 8.531 3.610
إجمالي التكلفة $1.024 $0.289
??? ??????? $3.000 / 1M $0.750 / 1M
??? ??????? $15.000 / 1M $4.500 / 1M
رموز الإخراج 35,174 1,708
رموز الاستدلال 24,687 58,019
زمن الاستجابة (المتوسط) 10.09s 15.66s
زمن الاستجابة (الحد الأقصى) 46.35s 102.91s
زمن الاستجابة (الإجمالي) 90.85s 266.14s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 6.5 10.0 50.0% 0 2.98s 1,046 1,093
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 296 2,876
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 10.0 10.0 100.0% 0 46.35s 5,871 3,962
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 317 4,317
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 10.0 10.0 100.0% 0 13.90s 649 742
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 234 650
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 2.9 7.2 11.1% 1 0ms 25,790 16,919
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 60 43,286
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.94s 256 433
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 150 510
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 10.0 10.0 100.0% 0 2.61s 318 552
GPT-5.4 Mini 7.4 6.5 66.7% 1 2.50s 129 1,337
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.80s 589 635
GPT-5.4 Mini 6.8 7.9 55.6% 1 4.33s 271 2,449
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 10.0 10.0 100.0% 0 7.48s 655 351
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 251 2,594

مقارنة سريعة

تبديل زوج المقارنة