AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Qwen: Qwen3.5-9B

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-12

المقياس	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium الإصدار: 2026-02-19	Qwen3.5-9B Qwen3.5-9B none الإصدار: 2026-03-02

المقياس	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium الإصدار: 2026-02-19	Qwen3.5-9B Qwen3.5-9B none الإصدار: 2026-03-02
الترتيب	#2	#60
متوسط الدرجة	9.4	3.4
الاتساق	10.0	10.0
التكلفة لكل نتيجة	3.417	0.111
إجمالي التكلفة	$0.513	$0.005
اختبارات صحيحة
معدل النجاح لكل محاولة	93.8%	25.0%
اختبارات غير مستقرة	0	0
إجمالي مرات التشغيل	48	48
رموز الإخراج	1,521	2,939
رموز الاستدلال	35,656	0
زمن الاستجابة (المتوسط)	16.60s	1.06s
زمن الاستجابة (الحد الأقصى)	40.61s	5.91s
زمن الاستجابة (الإجمالي)	149.36s	16.95s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

متوسط الدرجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

متوسط الدرجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.52s	106	2,533
Qwen3.5-9B	10.0	9.9	0.0%	0		1.02s	576	0

مجمّع	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	9.0	10.0	100.0%	0		40.61s	432	9,281
Qwen3.5-9B	10.0	10.0	0.0%	0		5.91s	1,255	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	9.9	10.0	100.0%	0		7.72s	279	3,904
Qwen3.5-9B	9.9	10.0	100.0%	0		847ms	249	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	7.0	10.0	66.7%	0		32.73s	18	12,424
Qwen3.5-9B	10.0	10.0	0.0%	0		464ms	24	0

الذكاء العام	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179
Qwen3.5-9B	3.0	9.9	0.0%	0		552ms	99	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236
Qwen3.5-9B	5.5	10.0	50.0%	0		514ms	75	0

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117
Qwen3.5-9B	10.0	9.9	0.0%	0		683ms	388	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	زمن الاستجابة (المتوسط)	رموز الإخراج	رموز الاستدلال
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982
Qwen3.5-9B	10.0	10.0	100.0%	0		1.27s	273	0

مقارنة سريعة

تبديل زوج المقارنة

Qwen3.5-9BnonevsGLM 4.7 Flashmedium MiniMax M2.5mediumvsQwen3.5-9Bnone Qwen3.5-9BnonevsGrok 4.20 Multi-Agent Betamedium gpt-oss-120bmediumمتاح مجانًاvsQwen3.5-9Bnone Mercury 2mediumvsQwen3.5-9Bnone Gemini 3.1 Pro PreviewmediumvsGPT-5.2 Chatnone GPT-5 NanomediumvsQwen3.5-9Bnone Gemini 3.1 Pro PreviewmediumvsGPT-5.3 Chatnone Nemotron 3 Super 120b A12bmediumمتاح مجانًاvsQwen3.5-9Bnone Hunter AlphamediumvsQwen3.5-9Bnone GPT-5 MinimediumvsQwen3.5-9Bnone Claude Sonnet 4.6nonevsGemini 3.1 Pro Previewmedium