التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 vs Hunter Alpha

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-12

المقياس GPT-5.4 GPT-5.4 none الإصدار: 2026-03-05 Hunter Alpha Hunter Alpha none الإصدار: تاريخ الإصدار غير معروف
الترتيب #51 #50
متوسط الدرجة 4.5 4.6
الاتساق 8.9 8.0
التكلفة لكل نتيجة 1.562 0.000
إجمالي التكلفة $0.094 $0.000
اختبارات صحيحة
معدل النجاح لكل محاولة 41.7% 52.1%
اختبارات غير مستقرة 2 4
إجمالي مرات التشغيل 48 48
رموز الإخراج 1,819 2,272
رموز الاستدلال 0 0
زمن الاستجابة (المتوسط) 1.48s 4.64s
زمن الاستجابة (الحد الأقصى) 2.89s 15.17s
زمن الاستجابة (الإجمالي) 23.64s 74.24s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

متوسط الدرجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

متوسط الدرجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
GPT-5.4 10.0 7.3 11.1% 1 1.41s 388 0
Hunter Alpha 1.3 7.4 22.2% 1 3.85s 773 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
GPT-5.4 10.0 10.0 0.0% 0 2.89s 291 0
Hunter Alpha 10.0 10.0 0.0% 0 15.17s 379 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
GPT-5.4 9.9 10.0 100.0% 0 1.04s 222 0
Hunter Alpha 9.9 10.0 100.0% 0 8.49s 249 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
GPT-5.4 4.0 7.2 44.4% 1 1.07s 50 0
Hunter Alpha 4.0 10.0 33.3% 0 2.33s 27 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
GPT-5.4 3.0 9.9 0.0% 0 1.78s 184 0
Hunter Alpha 5.0 3.1 66.7% 1 2.71s 91 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
GPT-5.4 5.5 10.0 50.0% 0 1.07s 81 0
Hunter Alpha 5.0 10.0 50.0% 0 2.82s 69 0
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
GPT-5.4 4.0 9.8 33.3% 0 1.52s 357 0
Hunter Alpha 4.0 4.4 66.7% 2 3.06s 349 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Hunter Alpha 10.0 10.0 100.0% 0 6.02s 335 0

مقارنة سريعة

تبديل زوج المقارنة