AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Qwen: Qwen3.5 Plus 2026-04-20

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-04-27

المقياس	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium الإصدار: 2026-02-19	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 none الإصدار: 2026-04-20

المقياس	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium الإصدار: 2026-02-19	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 none الإصدار: 2026-04-20
النتيجة	9.6	5.8
الترتيب	#2	#88
الموثوقية	غير متاح	9.8
الاتساق	10.0	8.3
اختبارات صحيحة
معدل النجاح لكل محاولة	94.4%	42.6%
اختبارات غير مستقرة	0	4
إجمالي مرات التشغيل	54	54
التكلفة لكل نتيجة	3.400	0.397
إجمالي التكلفة	$0.578	$0.024
??? ???????	$2.000 / 1M	$0.400 / 1M
??? ???????	$12.000 / 1M	$2.400 / 1M
رموز الإخراج	1,932	4,645
رموز الاستدلال	40,542	0
زمن الاستجابة (المتوسط)	15.96s	3.18s
زمن الاستجابة (الحد الأقصى)	40.61s	13.32s
زمن الاستجابة (الإجمالي)	175.52s	57.24s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	112	3,218
Qwen3.5 Plus 2026-04-20	4.8	10.0	25.0%	0		1.88s	557	0

البرمجة	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		19.88s	405	4,201
Qwen3.5 Plus 2026-04-20	5.3	3.4	33.3%	1		3.20s	450	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	432	9,281
Qwen3.5 Plus 2026-04-20	2.8	1.6	33.3%	1		13.32s	2,275	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	279	3,904
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		2.82s	243	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	18	12,424
Qwen3.5 Plus 2026-04-20	5.3	10.0	33.3%	0		4.43s	18	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179
Qwen3.5 Plus 2026-04-20	4.8	10.0	0.0%	0		1.41s	119	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236
Qwen3.5 Plus 2026-04-20	6.2	5.8	66.7%	1		1.17s	68	0

حل الألغاز	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117
Qwen3.5 Plus 2026-04-20	4.8	7.9	22.2%	1		2.03s	618	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		4.42s	297	0

مقارنة سريعة

تبديل زوج المقارنة

gpt-oss-120bmediumمتاح مجانًاvsQwen3.5 Plus 2026-04-20none MiniMax M2.5mediumمتاح مجانًاvsQwen3.5 Plus 2026-04-20none Mistral Small 4mediumvsQwen3.5 Plus 2026-04-20none Claude Opus 4.7nonevsGemini 3.1 Pro Previewmedium GPT-5 NanomediumvsQwen3.5 Plus 2026-04-20none MiniMax M2.7mediumvsQwen3.5 Plus 2026-04-20none Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Elephant AlphamediumvsQwen3.5 Plus 2026-04-20none Mercury 2mediumvsQwen3.5 Plus 2026-04-20none Qwen3.5 Plus 2026-04-20nonevsGrok 4.1 Fastmedium Nemotron 3 Supermediumمتاح مجانًاvsQwen3.5 Plus 2026-04-20none DeepSeek V4 ProhighvsQwen3.5 Plus 2026-04-20none