AI BENCHY Compare

Mistral: Mistral Small 4 vs Qwen: Qwen3.5-27B

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-17

المقياس	Mistral Small 4 Mistral Small 4 medium الإصدار: 2026-03-16	Qwen3.5-27B Qwen3.5-27B none الإصدار: 2026-02-24

المقياس	Mistral Small 4 Mistral Small 4 medium الإصدار: 2026-03-16	Qwen3.5-27B Qwen3.5-27B none الإصدار: 2026-02-24
الترتيب	#55	#54
النتيجة	5.6	5.6
الاتساق	7.0	9.1
التكلفة لكل نتيجة	0.502	0.303
إجمالي التكلفة	$0.026	$0.016
اختبارات صحيحة
معدل النجاح لكل محاولة	49.0%	35.3%
اختبارات غير مستقرة	6	2
إجمالي مرات التشغيل	51	51
رموز الإخراج	12,288	3,164
رموز الاستدلال	28,112	0
زمن الاستجابة (المتوسط)	4.18s	1.70s
زمن الاستجابة (الحد الأقصى)	25.25s	9.39s
زمن الاستجابة (الإجمالي)	71.03s	28.82s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Mistral Small 4	5.6	3.8	66.7%	3		2.67s	4,055	4,778
Qwen3.5-27B	4.8	10.0	25.0%	0		788ms	267	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Mistral Small 4	3.0	10.0	0.0%	0		25.25s	2,612	10,700
Qwen3.5-27B	2.8	1.6	33.3%	1		9.39s	1,461	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Mistral Small 4	7.3	5.9	83.3%	1		1.23s	335	723
Qwen3.5-27B	10.0	10.0	100.0%	0		1.43s	243	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Mistral Small 4	5.3	7.2	44.4%	1		6.11s	2,621	6,904
Qwen3.5-27B	3.0	10.0	0.0%	0		540ms	15	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Mistral Small 4	4.8	10.0	0.0%	0		2.05s	821	828
Qwen3.5-27B	5.0	10.0	0.0%	0		2.51s	126	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Mistral Small 4	7.3	5.8	83.3%	1		1.38s	540	1,031
Qwen3.5-27B	4.8	10.0	0.0%	0		815ms	69	0

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Mistral Small 4	3.4	9.7	0.0%	0		2.00s	983	2,338
Qwen3.5-27B	6.7	7.9	55.6%	1		1.37s	680	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Mistral Small 4	10.0	10.0	100.0%	0		3.50s	321	810
Qwen3.5-27B	10.0	10.0	100.0%	0		3.54s	303	0

مقارنة سريعة

تبديل زوج المقارنة

Mistral Small 4mediumvsGLM 5 Turbonone Mistral Small 4mediumvsGLM 4.7 Flashnone Mistral Small 4mediumvsGPT-5.4none Mistral Small 4mediumvsQwen3.5-122B-A10Bnone MiniMax M2.5mediumمتاح مجانًاvsQwen3.5-27Bnone Mistral Small 4mediumvsGrok 4.20 Betanone Mistral Small 4mediumvsKimi K2.5none Mistral Small 4mediumvsHunter Alphanone Trinity Large Previewnoneمتاح مجانًاvsMistral Small 4medium Mistral Small 4mediumvsQwen3.5-35B-A3Bnone Gemini 2.5 FlashnonevsMistral Small 4medium gpt-oss-120bmediumمتاح مجانًاvsQwen3.5-27Bnone