التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 2.5 Flash vs Qwen: Qwen3.5-35B-A3B

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس Google: Gemini 2.5 Flash none الإصدار: 2025-06-17 Qwen: Qwen3.5-35B-A3B medium الإصدار: 2026-02-24
الترتيب #36 #30
متوسط الدرجة 5.34 5.93
الاتساق 9.40 6.62
التكلفة لكل نتيجة 0.107 5.169
إجمالي التكلفة $0.007 $0.362
اختبارات صحيحة
معدل النجاح لكل محاولة 47.6% 73.8%
اختبارات غير مستقرة 1 6
رموز الإخراج 826 1,317
رموز الاستدلال 0 177,502

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 1.00 10.00 0.0% 0 99 0
Qwen: Qwen3.5-35B-A3B 10.00 10.00 100.0% 0 429 36,235
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 9.88 10.00 100.0% 0 279 0
Qwen: Qwen3.5-35B-A3B 5.50 5.87 83.3% 1 235 19,493
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 4.00 7.21 55.6% 1 12 0
Qwen: Qwen3.5-35B-A3B 1.00 4.41 44.5% 2 41 46,368
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 8.00 9.99 50.0% 0 70 0
Qwen: Qwen3.5-35B-A3B 8.00 6.80 66.7% 1 97 17,361
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 4.67 10.00 33.3% 0 132 0
Qwen: Qwen3.5-35B-A3B 4.33 4.70 66.7% 2 206 56,680
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 10.00 10.00 100.0% 0 234 0
Qwen: Qwen3.5-35B-A3B 10.00 10.00 100.0% 0 309 1,365

مقارنة سريعة

تبديل زوج المقارنة