قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Qwen: Qwen3 Coder Next

اسم النموذج:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في : 2026-02-27 15:16

الملخص

المقياس	Google: Gemini 3 Flash Preview medium الإصدار: تاريخ الإصدار غير معروف	Qwen: Qwen3 Coder Next none الإصدار: تاريخ الإصدار غير معروف
الترتيب	#1	#33
النتيجة	9.93	3.71
الاتساق	10.00	9.53
التكلفة لكل نتيجة	0.815	0.138
إجمالي التكلفة	$0.114	$0.005
اختبارات صحيحة
الاختبارات الخاطئة	0	11
معدل النجاح لكل محاولة	100.0%	26.2%
اختبارات غير مستقرة	0	1
رموز الإخراج	1,111	2,688
رموز الاستدلال	34,409	0

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3 Flash Preview	10.00	10.00	100.0%	0		299	3,127
Qwen: Qwen3 Coder Next	2.33	9.99	0.0%	0		1,315	0

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3 Flash Preview	10.00	10.00	100.0%	0		292	5,467
Qwen: Qwen3 Coder Next	5.50	10.00	50.0%	0		276	0

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3 Flash Preview	10.00	10.00	100.0%	0		12	15,295
Qwen: Qwen3 Coder Next	4.00	10.00	33.3%	0		24	0

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3 Flash Preview	10.00	10.00	100.0%	0		72	4,092
Qwen: Qwen3 Coder Next	4.50	6.88	33.3%	1		63	0

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3 Flash Preview	9.67	10.00	100.0%	0		202	5,298
Qwen: Qwen3 Coder Next	1.00	9.92	0.0%	0		755	0

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3 Flash Preview	10.00	10.00	100.0%	0		234	1,130
Qwen: Qwen3 Coder Next	10.00	10.00	100.0%	0		255	0

تبديل زوج المقارنة

قارن Google: Gemini 3 Flash Preview مع...

قارن Qwen: Qwen3 Coder Next مع...