AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs OpenAI: gpt-oss-120b

الملخص

مقارنة benchmark بين DeepSeek V4 Pro و gpt-oss-120b: يتقدم gpt-oss-120b في متوسط النتيجة بـ 6.1 مقابل 5.7. لدى gpt-oss-120b تكلفة benchmark أقل عند $0.013 مقابل $0.025. DeepSeek V4 Pro أسرع عند 12.38s مقابل 22.28s، مع معدلات نجاح 42.9% مقابل 52.4%.

النموذج الموصى به: gpt-oss-120b - It has the best score here (6.1), while costing about 2.0x less than DeepSeek V4 Pro.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-04

المقياس	DeepSeek V4 Pro DeepSeek V4 Pro none الإصدار: 2026-04-24	gpt-oss-120b gpt-oss-120b medium الإصدار: 2025-08-05 متاح مجانًا

المقياس	DeepSeek V4 Pro DeepSeek V4 Pro none الإصدار: 2026-04-24	gpt-oss-120b gpt-oss-120b medium الإصدار: 2025-08-05 متاح مجانًا
النتيجة	5.7	6.1
الترتيب	#113	#99
الموثوقية	8.5	10.0
الاتساق	8.5	8.0
اختبارات صحيحة
معدل النجاح لكل محاولة	42.9%	52.4%
اختبارات غير مستقرة	4	5
إجمالي مرات التشغيل	63	63
التكلفة لكل نتيجة	0.660	0.141
إجمالي التكلفة	$0.025	$0.013
سعر الإدخال	$0.435 / 1M	$0.039 / 1M
سعر الإخراج	$0.870 / 1M	$0.180 / 1M
إجمالي رموز الإدخال	44,845	39,084
رموز الإخراج	5,349	20,013
رموز الاستدلال	0	50,233
زمن الاستجابة (المتوسط)	12.38s	22.28s
زمن الاستجابة (الحد الأقصى)	58.65s	68.16s
زمن الاستجابة (الإجمالي)	260.06s	311.96s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#113 DeepSeek V4 Pro

none

Invalid SVG

Cost: $0.000
Time: 300.0s
Tokens: 0 tok

#99 gpt-oss-120b

medium

Cost: $0.001
Time: 26.7s
Tokens: 555 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	3.5	8.0	16.7%	1		14.02s	540	704	0
gpt-oss-120b	6.7	9.9	50.0%	0		10.21s	1,314	3,518	2,177

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	4.6	7.9	22.2%	1		6.11s	7,279	531	0
gpt-oss-120b	5.9	7.0	55.6%	1		38.37s	7,782	3,365	11,973

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	9.5	10.0	100.0%	0		25.49s	20,773	1,911	0
gpt-oss-120b	10.0	10.0	100.0%	0		31.18s	11,535	694	5,072

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	6.9	5.8	66.7%	1		30.54s	5,633	170	0
gpt-oss-120b	6.4	5.9	66.7%	1		1.98s	7,476	241	1,114

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	5.3	10.0	33.3%	0		3.17s	666	18	0
gpt-oss-120b	2.9	4.4	22.2%	2		50.92s	1,266	6,784	20,606

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	4.3	9.9	0.0%	0		3.75s	471	132	0
gpt-oss-120b	4.3	10.0	0.0%	0		7.90s	659	107	387

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	6.3	10.0	50.0%	0		8.23s	627	64	0
gpt-oss-120b	9.9	10.0	100.0%	0		7.63s	1,036	126	1,799

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	7.6	7.2	77.8%	1		15.95s	594	173	0
gpt-oss-120b	5.3	7.2	44.4%	1		21.71s	1,190	1,790	2,264

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	10.0	10.0	100.0%	0		5.92s	8,079	219	0
gpt-oss-120b	9.8	10.0	100.0%	0		6.91s	6,514	287	1,083

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإدخال	رموز الإخراج	رموز الاستدلال
DeepSeek V4 Pro	3.0	10.0	0.0%	0		15.59s	183	1,427	0
gpt-oss-120b	3.0	10.0	0.0%	0		26.51s	312	3,101	3,758

مقارنة سريعة

تبديل زوج المقارنة