AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-04-20 vs Xiaomi: MiMo-V2-Pro

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-27

المقياس	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 none الإصدار: 2026-04-20	MiMo-V2-Pro MiMo-V2-Pro none الإصدار: 2026-03-18

المقياس	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 none الإصدار: 2026-04-20	MiMo-V2-Pro MiMo-V2-Pro none الإصدار: 2026-03-18
النتيجة	5.8	6.0
الترتيب	#88	#83
الموثوقية	9.8	غير متاح
الاتساق	8.3	8.6
اختبارات صحيحة
معدل النجاح لكل محاولة	42.6%	48.2%
اختبارات غير مستقرة	4	3
إجمالي مرات التشغيل	54	54
التكلفة لكل نتيجة	0.397	0.601
إجمالي التكلفة	$0.024	$0.043
??? ???????	$0.400 / 1M	$1.000 / 1M
??? ???????	$2.400 / 1M	$3.000 / 1M
رموز الإخراج	4,645	2,320
رموز الاستدلال	0	0
زمن الاستجابة (المتوسط)	3.18s	2.39s
زمن الاستجابة (الحد الأقصى)	13.32s	6.58s
زمن الاستجابة (الإجمالي)	57.24s	43.06s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.5 Plus 2026-04-20	4.8	10.0	25.0%	0		1.88s	557	0
MiMo-V2-Pro	3.5	8.0	16.7%	1		1.80s	315	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.5 Plus 2026-04-20	5.3	3.4	33.3%	1		3.20s	450	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		3.82s	599	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.5 Plus 2026-04-20	2.8	1.6	33.3%	1		13.32s	2,275	0
MiMo-V2-Pro	3.0	10.0	0.0%	0		6.58s	333	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		2.82s	243	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		1.39s	249	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.5 Plus 2026-04-20	5.3	10.0	33.3%	0		4.43s	18	0
MiMo-V2-Pro	5.3	7.2	44.4%	1		1.78s	26	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.5 Plus 2026-04-20	4.8	10.0	0.0%	0		1.41s	119	0
MiMo-V2-Pro	4.3	9.9	0.0%	0		2.44s	125	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.5 Plus 2026-04-20	6.2	5.8	66.7%	1		1.17s	68	0
MiMo-V2-Pro	6.5	10.0	50.0%	0		2.51s	69	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.5 Plus 2026-04-20	4.8	7.9	22.2%	1		2.03s	618	0
MiMo-V2-Pro	6.0	7.1	55.6%	1		1.83s	327	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		4.42s	297	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		4.39s	277	0

مقارنة سريعة

تبديل زوج المقارنة

gpt-oss-120bmediumمتاح مجانًاvsQwen3.5 Plus 2026-04-20none MiniMax M2.5mediumمتاح مجانًاvsQwen3.5 Plus 2026-04-20none Mistral Small 4mediumvsQwen3.5 Plus 2026-04-20none gpt-oss-120bmediumمتاح مجانًاvsMiMo-V2-Pronone GPT-5 NanomediumvsMiMo-V2-Pronone MiniMax M2.5mediumمتاح مجانًاvsMiMo-V2-Pronone Mistral Small 4mediumvsMiMo-V2-Pronone GPT-5 NanomediumvsQwen3.5 Plus 2026-04-20none Mercury 2mediumvsMiMo-V2-Pronone MiniMax M2.7mediumvsQwen3.5 Plus 2026-04-20none Elephant AlphamediumvsQwen3.5 Plus 2026-04-20none Grok 4.1 FastmediumvsMiMo-V2-Pronone