AI BENCHY Compare

Mistral: Mistral Small 4 vs OpenAI: GPT-4o-mini

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-17

المقياس	Mistral Small 4 Mistral Small 4 medium الإصدار: 2026-03-16	GPT-4o-mini GPT-4o-mini none الإصدار: 2024-07-18

المقياس	Mistral Small 4 Mistral Small 4 medium الإصدار: 2026-03-16	GPT-4o-mini GPT-4o-mini none الإصدار: 2024-07-18
الترتيب	#55	#63
النتيجة	5.6	5.0
الاتساق	7.0	10.0
التكلفة لكل نتيجة	0.502	0.115
إجمالي التكلفة	$0.026	$0.005
اختبارات صحيحة
معدل النجاح لكل محاولة	49.0%	23.5%
اختبارات غير مستقرة	6	0
إجمالي مرات التشغيل	51	51
رموز الإخراج	12,288	1,600
رموز الاستدلال	28,112	0
زمن الاستجابة (المتوسط)	4.18s	1.94s
زمن الاستجابة (الحد الأقصى)	25.25s	7.58s
زمن الاستجابة (الإجمالي)	71.03s	19.44s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Mistral Small 4	5.6	3.8	66.7%	3		2.67s	4,055	4,778
GPT-4o-mini	4.8	10.0	25.0%	0		1.34s	186	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Mistral Small 4	3.0	10.0	0.0%	0		25.25s	2,612	10,700
GPT-4o-mini	3.0	10.0	0.0%	0		7.58s	568	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Mistral Small 4	7.3	5.9	83.3%	1		1.23s	335	723
GPT-4o-mini	10.0	10.0	100.0%	0		1.27s	183	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Mistral Small 4	5.3	7.2	44.4%	1		6.11s	2,621	6,904
GPT-4o-mini	3.0	10.0	0.0%	0		637ms	15	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Mistral Small 4	4.8	10.0	0.0%	0		2.05s	821	828
GPT-4o-mini	4.0	10.0	0.0%	0		909ms	66	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Mistral Small 4	7.3	5.8	83.3%	1		1.38s	540	1,031
GPT-4o-mini	4.8	10.0	0.0%	0		1.27s	69	0

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Mistral Small 4	3.4	9.7	0.0%	0		2.00s	983	2,338
GPT-4o-mini	3.7	10.0	0.0%	0		1.30s	308	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Mistral Small 4	10.0	10.0	100.0%	0		3.50s	321	810
GPT-4o-mini	10.0	10.0	100.0%	0		2.51s	205	0

مقارنة سريعة

تبديل زوج المقارنة

Mistral Small 4mediumvsGLM 5 Turbonone Mistral Small 4mediumvsGLM 4.7 Flashnone Mistral Small 4mediumvsQwen3.5-27Bnone Mistral Small 4mediumvsGPT-5.4none Mistral Small 4mediumvsQwen3.5-122B-A10Bnone GPT-4o-mininonevsQwen3 Coder Nextmedium Mistral Small 4mediumvsGrok 4.20 Betanone Mistral Small 4mediumvsKimi K2.5none Mistral Small 4mediumvsHunter Alphanone Trinity Large Previewnoneمتاح مجانًاvsMistral Small 4medium Mistral Small 4mediumvsQwen3.5-35B-A3Bnone Gemini 2.5 FlashnonevsMistral Small 4medium