AI BENCHY Compare

OpenAI: GPT-5.5 vs HY3 Preview

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-26

المقياس	GPT-5.5 GPT-5.5 low الإصدار: 2026-04-24	HY3 Preview HY3 Preview high الإصدار: 2026-04-22 متاح مجانًا

المقياس	GPT-5.5 GPT-5.5 low الإصدار: 2026-04-24	HY3 Preview HY3 Preview high الإصدار: 2026-04-22 متاح مجانًا
النتيجة	9.0	8.5
الترتيب	#5	#11
الموثوقية	10.0	غير متاح
الاتساق	9.6	8.8
اختبارات صحيحة
معدل النجاح لكل محاولة	87.0%	81.5%
اختبارات غير مستقرة	1	3
إجمالي مرات التشغيل	54	50
التكلفة لكل نتيجة	4.534	0.000
إجمالي التكلفة	$0.681	$0.000
??? ???????	$5.000 / 1M	$0.000 / 1M
??? ???????	$30.000 / 1M	$0.000 / 1M
رموز الإخراج	1,959	238,920
رموز الاستدلال	16,134	0
زمن الاستجابة (المتوسط)	8.39s	55.19s
زمن الاستجابة (الحد الأقصى)	56.19s	149.94s
زمن الاستجابة (الإجمالي)	151.01s	938.23s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		4.15s	232	1,056
HY3 Preview	10.0	10.0	100.0%	0		32.69s	26,550	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		7.79s	369	936
HY3 Preview	10.0	10.0	100.0%	0		99.76s	38,167	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		9.56s	303	717
HY3 Preview	10.0	10.0	100.0%	0		113.09s	31,319	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		3.28s	228	157
HY3 Preview	6.5	10.0	50.0%	0		12.11s	4,323	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.5	5.3	10.0	33.3%	0		27.57s	69	11,731
HY3 Preview	5.3	7.2	44.4%	1		109.04s	87,559	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		3.45s	143	132
HY3 Preview	10.0	10.0	100.0%	0		24.31s	5,490	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.5	9.9	10.0	100.0%	0		2.98s	93	356
HY3 Preview	8.5	6.8	83.3%	1		34.02s	13,331	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.5	9.0	7.9	88.9%	1		4.48s	272	948
HY3 Preview	9.0	7.9	88.9%	1		28.07s	21,811	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
GPT-5.5	10.0	10.0	100.0%	0		4.96s	250	101
HY3 Preview	10.0	10.0	100.0%	0		78.83s	10,370	0

مقارنة سريعة

تبديل زوج المقارنة

Qwen3.5 Plus 2026-02-15mediumvsHY3 Previewhighمتاح مجانًا Qwen3.6 Plus Previewmediumمتاح مجانًاvsHY3 Previewhighمتاح مجانًا Qwen3.5-27BmediumvsHY3 Previewhighمتاح مجانًا GPT-5.3-CodexmediumvsHY3 Previewhighمتاح مجانًا Gemini 3 PRO PreviewmediumvsHY3 Previewhighمتاح مجانًا Seed-2.0-LitemediumvsHY3 Previewhighمتاح مجانًا HY3 Previewhighمتاح مجانًاvsGLM 5medium Claude Opus 4.7nonevsGPT-5.5low Gemma 4 31Bmediumمتاح مجانًاvsHY3 Previewhighمتاح مجانًا Claude Opus 4.7mediumvsGPT-5.5low Gemini 2.5 FlashmediumvsHY3 Previewhighمتاح مجانًا GPT-5.4mediumvsHY3 Previewhighمتاح مجانًا