التنقل
AI BENCHY
Your ad here

AI BENCHY Compare

HY3 Preview vs Grok 4.20 Beta

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-26

المقياس HY3 Preview HY3 Preview high الإصدار: 2026-04-22 متاح مجانًا Grok 4.20 Beta Grok 4.20 Beta none الإصدار: 2026-03-12
النتيجة 8.5 5.3
الترتيب #11 #93
الموثوقية غير متاح غير متاح
الاتساق 8.8 9.2
اختبارات صحيحة
معدل النجاح لكل محاولة 81.5% 29.6%
اختبارات غير مستقرة 3 2
إجمالي مرات التشغيل 50 52
التكلفة لكل نتيجة 0.000 2.255
إجمالي التكلفة $0.000 $0.091
??? ??????? $0.000 / 1M $0.000 / 1M
??? ??????? $0.000 / 1M $0.000 / 1M
رموز الإخراج 238,920 1,591
رموز الاستدلال 0 0
زمن الاستجابة (المتوسط) 55.19s 1.19s
زمن الاستجابة (الحد الأقصى) 149.94s 6.48s
زمن الاستجابة (الإجمالي) 938.23s 21.37s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
HY3 Preview 10.0 10.0 100.0% 0 32.69s 26,550 0
Grok 4.20 Beta 4.0 8.4 16.7% 1 597ms 251 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
HY3 Preview 10.0 10.0 100.0% 0 99.76s 38,167 0
Grok 4.20 Beta 5.5 10.0 0.0% 0 1.14s 74 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
HY3 Preview 10.0 10.0 100.0% 0 113.09s 31,319 0
Grok 4.20 Beta 3.0 10.0 0.0% 0 6.48s 282 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
HY3 Preview 6.5 10.0 50.0% 0 12.11s 4,323 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 601ms 197 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
HY3 Preview 5.3 7.2 44.4% 1 109.04s 87,559 0
Grok 4.20 Beta 3.0 10.0 0.0% 0 611ms 160 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
HY3 Preview 10.0 10.0 100.0% 0 24.31s 5,490 0
Grok 4.20 Beta 5.0 10.0 0.0% 0 541ms 87 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
HY3 Preview 8.5 6.8 83.3% 1 34.02s 13,331 0
Grok 4.20 Beta 4.8 10.0 0.0% 0 687ms 60 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
HY3 Preview 9.0 7.9 88.9% 1 28.07s 21,811 0
Grok 4.20 Beta 5.9 7.2 55.6% 1 541ms 291 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
HY3 Preview 10.0 10.0 100.0% 0 78.83s 10,370 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.79s 189 0

مقارنة سريعة

تبديل زوج المقارنة