قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.5 Plus 2026-02-15

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس	Google: Gemini 3.1 Flash Lite Preview none الإصدار: 2026-03-03	Qwen: Qwen3.5 Plus 2026-02-15 medium الإصدار: 2026-02-15
الترتيب	#10	#4
متوسط الدرجة	7.70	8.64
الاتساق	9.54	10.00
التكلفة لكل نتيجة	0.116	1.955
إجمالي التكلفة	$0.011	$0.235
اختبارات صحيحة
معدل النجاح لكل محاولة	69.1%	85.7%
اختبارات غير مستقرة	1	0
رموز الإخراج	4,307	1,258
رموز الاستدلال	0	93,374

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	6.00	7.85	55.6%	1		1,086	0
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		186	5,926

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	9.88	10.00	100.0%	0		399	0
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		283	14,892

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	4.00	10.00	33.3%	0		568	0
Qwen: Qwen3.5 Plus 2026-02-15	4.00	10.00	33.3%	0		56	39,882

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	9.00	10.00	50.0%	0		574	0
Qwen: Qwen3.5 Plus 2026-02-15	9.50	9.99	100.0%	0		102	9,257

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		898	0
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		322	22,508

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		782	0
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		309	909

مقارنة سريعة

تبديل زوج المقارنة

Gemini 3.1 Flash Lite PreviewnonevsGPT-5.3-Codexmedium Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3 Flash PreviewlowvsQwen3.5 Plus 2026-02-15medium Gemini 3.1 Flash Lite PreviewnonevsGLM 5medium Gemini 3.1 Flash Lite PreviewnonevsStep 3.5 Flashmediumمتاح مجانًا DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5.2medium Gemini 3.1 Flash Lite PreviewlowvsQwen3.5 Plus 2026-02-15medium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-27Bmedium Gemini 3.1 Flash Lite PreviewhighvsQwen3.5 Plus 2026-02-15medium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-122B-A10Bmedium GPT-5.2 ChatnonevsQwen3.5 Plus 2026-02-15medium