AI BENCHY Compare

Qwen3.6 Plus Preview vs Xiaomi: MiMo-V2-Omni

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-01

المقياس	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium الإصدار: 2026-04-20 متاح مجانًا	MiMo-V2-Omni MiMo-V2-Omni medium الإصدار: 2026-03-18

المقياس	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium الإصدار: 2026-04-20 متاح مجانًا	MiMo-V2-Omni MiMo-V2-Omni medium الإصدار: 2026-03-18
النتيجة	8.5	7.7
الترتيب	#15	#49
الموثوقية	غير متاح	غير متاح
الاتساق	10.0	9.9
اختبارات صحيحة
معدل النجاح لكل محاولة	76.5%	61.1%
اختبارات غير مستقرة	0	0
إجمالي مرات التشغيل	49	20
التكلفة لكل نتيجة	0.000	1.383
إجمالي التكلفة	$0.000	$0.153
??? ???????	$0.000 / 1M	$0.400 / 1M
??? ???????	$0.000 / 1M	$2.000 / 1M
رموز الإخراج	1,756	928
رموز الاستدلال	77,213	72,661
زمن الاستجابة (المتوسط)	13.94s	16.76s
زمن الاستجابة (الحد الأقصى)	43.55s	158.78s
زمن الاستجابة (الإجمالي)	237.01s	301.61s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		9.90s	207	7,557
MiMo-V2-Omni	10.0	10.0	100.0%	0		2.11s	112	402

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		34.95s	452	13,073
MiMo-V2-Omni	10.0	10.0	100.0%	0		19.29s	131	2,807

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		14.95s	270	10,706
MiMo-V2-Omni	10.0	10.0	100.0%	0		2.29s	87	323

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.6 Plus Preview	3.0	10.0	0.0%	0		22.08s	49	26,895
MiMo-V2-Omni	3.0	10.0	0.0%	0		55.12s	13	33,279

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.6 Plus Preview	5.1	10.0	0.0%	0		27.05s	111	5,232
MiMo-V2-Omni	10.0	10.0	100.0%	0		2.86s	58	202

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		7.54s	102	5,552
MiMo-V2-Omni	8.3	10.0	50.0%	0		4.92s	35	201

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		6.11s	298	6,868
MiMo-V2-Omni	6.5	10.0	33.3%	0		3.88s	126	481

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		5.87s	267	1,330
MiMo-V2-Omni	10.0	10.0	100.0%	0		11.07s	101	1,306

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Qwen3.6 Plus Preview	-	-	-	-	-	-	-	-
MiMo-V2-Omni	4.0	7.9	0.0%	0		68.55s	265	33,660

مقارنة سريعة

تبديل زوج المقارنة

DeepSeek V4 FlashhighvsMiMo-V2-Omnimedium GPT-5.3 ChatnonevsMiMo-V2-Omnimedium Qwen3.6 Max PreviewnonevsMiMo-V2-Omnimedium Qwen3.6 Plus Previewmediumمتاح مجانًاvsHY3 Previewhighمتاح مجانًا Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2-Omnimedium GPT-5.2 ChatnonevsMiMo-V2-Omnimedium Claude Sonnet 4.6nonevsMiMo-V2-Omnimedium Qwen3.6 Plus Previewmediumمتاح مجانًاvsHY3 Previewlowمتاح مجانًا Gemini 3 Flash PreviewnonevsQwen3.6 Plus Previewmediumمتاح مجانًا Gemini 3 Flash PreviewlowvsQwen3.6 Plus Previewmediumمتاح مجانًا Gemini 3.1 Flash Lite PreviewlowvsQwen3.6 Plus Previewmediumمتاح مجانًا Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2-Omnimedium