قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-5 Mini vs OpenAI: gpt-oss-120b

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس	OpenAI: GPT-5 Mini medium الإصدار: 2025-08-07	OpenAI: gpt-oss-120b medium الإصدار: 2025-08-05 متاح مجانًا
الترتيب	#33	#34
متوسط الدرجة	5.77	5.64
الاتساق	8.79	7.55
التكلفة لكل نتيجة	1.200	0.101
إجمالي التكلفة	$0.084	$0.008
اختبارات صحيحة
معدل النجاح لكل محاولة	57.1%	59.5%
اختبارات غير مستقرة	2	4
رموز الإخراج	4,723	11,407
رموز الاستدلال	35,392	26,106

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	7.00	9.62	66.7%	0		1,645	5,824
OpenAI: gpt-oss-120b	7.00	9.81	66.7%	0		3,463	2,077

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	9.88	10.00	100.0%	0		453	3,200
OpenAI: gpt-oss-120b	5.50	5.87	66.7%	1		241	1,114

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	1.00	7.21	22.2%	1		293	14,016
OpenAI: gpt-oss-120b	1.00	4.41	22.2%	2		6,018	18,520

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	7.00	6.64	66.7%	1		318	4,992
OpenAI: gpt-oss-120b	10.00	10.00	100.0%	0		120	1,770

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	4.33	9.78	33.3%	0		1,527	5,760
OpenAI: gpt-oss-120b	5.00	7.13	44.4%	1		1,278	1,542

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	10.00	10.00	100.0%	0		487	1,600
OpenAI: gpt-oss-120b	9.00	9.97	100.0%	0		287	1,083

مقارنة سريعة

تبديل زوج المقارنة

GPT-5 MinimediumvsGLM 5none Gemini 2.5 Flashnonevsgpt-oss-120bmediumمتاح مجانًا gpt-oss-120bmediumمتاح مجانًاvsGLM 5none Gemini 2.5 FlashnonevsGPT-5 Minimedium gpt-oss-120bmediumمتاح مجانًاvsQwen3.5-122B-A10Bnone GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none GPT-5 MinimediumvsQwen3.5-122B-A10Bnone Claude Sonnet 4.6nonevsGPT-5 Minimedium gpt-oss-120bmediumمتاح مجانًاvsQwen3.5 Plus 2026-02-15none Claude Sonnet 4.6nonevsgpt-oss-120bmediumمتاح مجانًا DeepSeek V3.2nonevsgpt-oss-120bmediumمتاح مجانًا gpt-oss-120bmediumمتاح مجانًاvsQwen3.5-27Bnone