GPT-5.4 Mini (medium) vs Qwen3.5 Plus 2026-02-15 (medium)

متوسط النتيجة متقارب جدًا عند 7.5 مقابل 7.5. لدى Qwen3.5 Plus 2026-02-15 (medium) تكلفة benchmark أقل عند $0.437 مقابل $0.756. GPT-5.4 Mini (medium) أسرع عند 25.94s مقابل 89.19s، مع معدلات نجاح 71.2% مقابل 71.2%.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-08-01

الترتيب: #69
إجمالي رموز الإخراج: 151,755
زمن الاستجابة (المتوسط): 25.94s
إجمالي التكلفة: $0.756

الترتيب: #70
إجمالي رموز الإخراج: 260,704
زمن الاستجابة (المتوسط): 89.19s
إجمالي التكلفة: $0.437

النموذج الموصى به GPT-5.4 Mini (medium)

It has the best score here (7.5), while responding about 3.4x faster than Qwen3.5 Plus 2026-02-15 (medium).

مقارنة تفصيلية

المقياس	GPT-5.4 Mini GPT-5.4 Mini medium الإصدار: 2026-03-17	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium الإصدار: 2026-02-15

المقياس	GPT-5.4 Mini GPT-5.4 Mini medium الإصدار: 2026-03-17	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium الإصدار: 2026-02-15
النتيجة	7.5	7.5
الترتيب	#69	#70
الموثوقية	10.0	10.0
الاتساق	7.7	8.5
اختبارات صحيحة
معدل النجاح لكل محاولة	71.2%	71.2%
اختبارات غير مستقرة	6	4
إجمالي مرات التشغيل	66	66
التكلفة لكل نتيجة	6.299	3.348
إجمالي التكلفة	$0.756	$0.437
سعر الإدخال	$0.750 / 1M	$0.260 / 1M
سعر الإخراج	$4.500 / 1M	$1.560 / 1M
إجمالي رموز الإدخال	97,155	113,560
رموز الإخراج	6,211	9,823
رموز الاستدلال	145,544	250,881
زمن الاستجابة (المتوسط)	25.94s	89.19s
زمن الاستجابة (الحد الأقصى)	138.75s	304.85s
زمن الاستجابة (الإجمالي)	570.66s	1337.92s

عرض إنشاء النماذج

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#69 GPT-5.4 Mini

medium

التكلفة: $0.056
الوقت: 95.5s
الرموز: 12,464 tok

#70 Qwen3.5 Plus 2026-02-15

medium

التكلفة: $0.011
الوقت: 125.5s
الرموز: 7,040 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

الفئة:

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4 Mini	8.6	7.9	91.7%	1		4.05s	606	296	2,876
Qwen3.5 Plus 2026-02-15	8.2	7.9	83.3%	1		45.78s	672	205	21,236

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4 Mini	8.4	7.4	88.9%	1		57.87s	7,305	467	40,902
Qwen3.5 Plus 2026-02-15	6.6	7.1	44.4%	1		180.70s	6,950	420	80,595

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4 Mini	6.9	5.9	66.7%	1		59.64s	74,058	4,347	40,924
Qwen3.5 Plus 2026-02-15	6.9	5.9	66.7%	1		175.85s	87,576	8,085	69,183

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4 Mini	10.0	10.0	100.0%	0		2.43s	7,140	234	650
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		46.91s	7,782	270	14,916

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4 Mini	4.1	4.4	44.5%	2		65.31s	619	60	43,286
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		17.50s	444	35	16,680

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4 Mini	4.5	10.0	0.0%	0		3.72s	477	150	510
Qwen3.5 Plus 2026-02-15	4.7	1.6	66.7%	1		79.86s	344	73	8,675

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4 Mini	9.8	10.0	100.0%	0		2.13s	660	96	1,185
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		31.93s	699	101	7,704

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4 Mini	7.8	10.0	66.7%	0		4.37s	642	278	2,443
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		32.50s	696	301	13,853

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4 Mini	4.7	1.6	66.7%	1		9.62s	5,453	251	2,594
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		7.54s	8,193	309	909

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
GPT-5.4 Mini	3.0	10.0	0.0%	0		30.10s	195	32	10,174
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		103.81s	204	24	17,130

مقارنة سريعة

تبديل زوج المقارنة

GPT-5.6 TerralowvsQwen3.5 Plus 2026-02-15medium GPT-5.3 ChatnonevsQwen3.5 Plus 2026-02-15medium GPT-5.4 MinimediumvsQwen3.7 Maxnone Claude Opus 5nonevsGPT-5.4 Minimedium Claude Opus 5nonevsQwen3.5 Plus 2026-02-15medium Gemini 3 Flash PreviewlowvsQwen3.5 Plus 2026-02-15medium KAT-Coder-Pro V2.5lowvsQwen3.5 Plus 2026-02-15medium Gemini 3 Flash PreviewlowvsGPT-5.4 Minimedium KAT-Coder-Pro V2.5lowvsGPT-5.4 Minimedium Claude Sonnet 4.6nonevsQwen3.5 Plus 2026-02-15medium Claude Sonnet 4.6nonevsGPT-5.4 Minimedium DeepSeek V4 ProhighvsGPT-5.4 Minimedium