AI BENCHY Compare

Qwen: Qwen3.7 Max vs Xiaomi: MiMo-V2-Pro

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-22

المقياس	Qwen3.7 Max Qwen3.7 Max none الإصدار: 2026-05-22	MiMo-V2-Pro MiMo-V2-Pro medium الإصدار: 2026-03-18

المقياس	Qwen3.7 Max Qwen3.7 Max none الإصدار: 2026-05-22	MiMo-V2-Pro MiMo-V2-Pro medium الإصدار: 2026-03-18
النتيجة	7.9	7.6
الترتيب	#26	#44
الموثوقية	10.0	9.5
الاتساق	10.0	7.9
اختبارات صحيحة
معدل النجاح لكل محاولة	70.0%	76.7%
اختبارات غير مستقرة	0	5
إجمالي مرات التشغيل	60	60
التكلفة لكل نتيجة	0.719	2.453
إجمالي التكلفة	$0.101	$0.295
??? ???????	$2.500 / 1M	$1.000 / 1M
??? ???????	$7.500 / 1M	$3.000 / 1M
رموز الإخراج	1,988	2,556
رموز الاستدلال	0	81,879
زمن الاستجابة (المتوسط)	1.30s	22.19s
زمن الاستجابة (الحد الأقصى)	3.92s	136.29s
زمن الاستجابة (الإجمالي)	25.95s	443.77s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.7 Max	6.5	10.0	50.0%	0		1.08s	242	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		2.86s	251	1,154

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.7 Max	6.8	10.0	50.0%	0		1.39s	576	0
MiMo-V2-Pro	7.5	6.0	83.3%	1		94.21s	527	37,424

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.7 Max	3.0	10.0	0.0%	0		2.17s	171	0
MiMo-V2-Pro	4.7	1.6	66.7%	1		64.71s	380	14,186

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.7 Max	10.0	10.0	100.0%	0		1.35s	243	0
MiMo-V2-Pro	7.3	5.8	83.3%	1		17.20s	260	7,484

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.7 Max	7.7	10.0	66.7%	0		975ms	15	0
MiMo-V2-Pro	5.3	10.0	33.3%	0		8.82s	170	2,158

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.7 Max	10.0	10.0	100.0%	0		1.04s	120	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		4.92s	184	400

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.7 Max	10.0	10.0	100.0%	0		943ms	72	0
MiMo-V2-Pro	9.9	10.0	100.0%	0		3.36s	83	667

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.7 Max	10.0	10.0	100.0%	0		1.13s	314	0
MiMo-V2-Pro	6.4	4.4	77.8%	2		5.26s	410	1,700

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.7 Max	10.0	10.0	100.0%	0		3.92s	222	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		8.19s	263	864

معلومات عامة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.7 Max	3.0	10.0	0.0%	0		856ms	13	0
MiMo-V2-Pro	3.0	10.0	0.0%	0		82.71s	28	15,842

مقارنة سريعة

تبديل زوج المقارنة

GPT-5.4mediumvsQwen3.7 Maxnone Qwen3.7 MaxnonevsGLM 5 Turbomedium GPT-5.2 ChatnonevsMiMo-V2-Promedium Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2-Promedium Gemini 3.5 FlashminimalvsQwen3.7 Maxnone Gemini 3 Flash PreviewnonevsMiMo-V2-Promedium Gemma 4 31Bmediumمتاح مجانًاvsQwen3.7 Maxnone Qwen3.7 MaxnonevsGrok 4.3medium Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2-Promedium Seed-2.0-LitemediumvsQwen3.7 Maxnone Gemini 3.1 Flash LitelowvsMiMo-V2-Promedium Gemini 3.1 Flash Lite PreviewmediumvsQwen3.7 Maxnone