التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.5-27B

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس Google: Gemini 3.1 Flash Lite Preview high الإصدار: 2026-03-03 Qwen: Qwen3.5-27B medium الإصدار: 2026-02-24
الترتيب #9 #5
متوسط الدرجة 7.77 8.55
الاتساق 9.99 9.55
التكلفة لكل نتيجة 17.286 2.950
إجمالي التكلفة $1.729 $0.325
اختبارات صحيحة
معدل النجاح لكل محاولة 71.4% 83.3%
اختبارات غير مستقرة 0 1
رموز الإخراج 831 1,091
رموز الاستدلال 1,148,955 131,807

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 144 193,077
Qwen: Qwen3.5-27B 10.00 10.00 100.0% 0 102 8,956
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 9.88 10.00 100.0% 0 279 6,186
Qwen: Qwen3.5-27B 9.88 10.00 100.0% 0 270 16,150
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 4.00 10.00 33.3% 0 18 566,202
Qwen: Qwen3.5-27B 4.00 10.00 33.3% 0 43 52,368
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 8.00 9.96 50.0% 0 69 190,053
Qwen: Qwen3.5-27B 9.00 6.88 83.3% 1 97 11,638
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 7.00 10.00 66.7% 0 87 190,953
Qwen: Qwen3.5-27B 10.00 10.00 100.0% 0 231 41,372
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 234 2,484
Qwen: Qwen3.5-27B 10.00 10.00 100.0% 0 348 1,323

مقارنة سريعة

تبديل زوج المقارنة