قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.5 Plus 2026-02-15

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس	Google: Gemini 3.1 Flash Lite Preview low الإصدار: 2026-03-03	Qwen: Qwen3.5 Plus 2026-02-15 medium الإصدار: 2026-02-15
الترتيب	#8	#4
متوسط الدرجة	7.84	8.64
الاتساق	10.00	10.00
التكلفة لكل نتيجة	0.151	1.955
إجمالي التكلفة	$0.016	$0.235
اختبارات صحيحة
معدل النجاح لكل محاولة	71.4%	85.7%
اختبارات غير مستقرة	0	0
رموز الإخراج	1,317	1,258
رموز الاستدلال	6,126	93,374

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	7.00	10.00	66.7%	0		456	1,224
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		186	5,926

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	9.88	10.00	100.0%	0		291	696
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		283	14,892

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	4.00	10.00	33.3%	0		18	1,212
Qwen: Qwen3.5 Plus 2026-02-15	4.00	10.00	33.3%	0		56	39,882

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	8.50	10.00	50.0%	0		72	753
Qwen: Qwen3.5 Plus 2026-02-15	9.50	9.99	100.0%	0		102	9,257

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		243	1,248
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		322	22,508

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		237	993
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		309	909

مقارنة سريعة

تبديل زوج المقارنة

Gemini 3.1 Flash Lite PreviewlowvsGPT-5.3-Codexmedium Gemini 3 Flash PreviewlowvsQwen3.5 Plus 2026-02-15medium Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewlow Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewlowvsGLM 5medium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.3 Chatnone Gemini 3.1 Flash Lite PreviewlowvsQwen3.5-27Bmedium Gemini 3.1 Flash Lite PreviewlowvsStep 3.5 Flashmediumمتاح مجانًا DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewlow Gemini 3.1 Flash Lite PreviewhighvsQwen3.5 Plus 2026-02-15medium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2medium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5 Plus 2026-02-15medium