التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.5 Plus 2026-02-15

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس Google: Gemini 3.1 Flash Lite Preview none الإصدار: 2026-03-03 Qwen: Qwen3.5 Plus 2026-02-15 medium الإصدار: 2026-02-15
الترتيب #10 #4
متوسط الدرجة 7.70 8.64
الاتساق 9.54 10.00
التكلفة لكل نتيجة 0.116 1.955
إجمالي التكلفة $0.011 $0.235
اختبارات صحيحة
معدل النجاح لكل محاولة 69.1% 85.7%
اختبارات غير مستقرة 1 0
رموز الإخراج 4,307 1,258
رموز الاستدلال 0 93,374

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 6.00 7.85 55.6% 1 1,086 0
Qwen: Qwen3.5 Plus 2026-02-15 10.00 10.00 100.0% 0 186 5,926
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 9.88 10.00 100.0% 0 399 0
Qwen: Qwen3.5 Plus 2026-02-15 10.00 10.00 100.0% 0 283 14,892
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 4.00 10.00 33.3% 0 568 0
Qwen: Qwen3.5 Plus 2026-02-15 4.00 10.00 33.3% 0 56 39,882
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 9.00 10.00 50.0% 0 574 0
Qwen: Qwen3.5 Plus 2026-02-15 9.50 9.99 100.0% 0 102 9,257
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 898 0
Qwen: Qwen3.5 Plus 2026-02-15 10.00 10.00 100.0% 0 322 22,508
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 782 0
Qwen: Qwen3.5 Plus 2026-02-15 10.00 10.00 100.0% 0 309 909

مقارنة سريعة

تبديل زوج المقارنة