التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.5-122B-A10B

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس Google: Gemini 3.1 Flash Lite Preview low الإصدار: 2026-03-03 Qwen: Qwen3.5-122B-A10B medium الإصدار: 2026-02-24
الترتيب #8 #21
متوسط الدرجة 7.84 6.77
الاتساق 10.00 8.22
التكلفة لكل نتيجة 0.151 5.137
إجمالي التكلفة $0.016 $0.463
اختبارات صحيحة
معدل النجاح لكل محاولة 71.4% 76.2%
اختبارات غير مستقرة 0 3
رموز الإخراج 1,317 16,751
رموز الاستدلال 6,126 125,394

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 7.00 10.00 66.7% 0 456 1,224
Qwen: Qwen3.5-122B-A10B 10.00 10.00 100.0% 0 248 10,486
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 9.88 10.00 100.0% 0 291 696
Qwen: Qwen3.5-122B-A10B 9.88 10.00 100.0% 0 270 16,558
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 4.00 10.00 33.3% 0 18 1,212
Qwen: Qwen3.5-122B-A10B 1.00 7.21 11.1% 1 15,537 64,889
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 8.50 10.00 50.0% 0 72 753
Qwen: Qwen3.5-122B-A10B 5.50 5.92 83.3% 1 77 7,372
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 243 1,248
Qwen: Qwen3.5-122B-A10B 7.00 7.21 88.9% 1 297 24,863
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
Google: Gemini 3.1 Flash Lite Preview 10.00 10.00 100.0% 0 237 993
Qwen: Qwen3.5-122B-A10B 10.00 10.00 100.0% 0 322 1,226

مقارنة سريعة

تبديل زوج المقارنة