التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemma 4 31B vs Qwen: Qwen3.5-Flash

الملخص

مقارنة benchmark بين Gemma 4 31B و Qwen3.5-Flash: يتقدم Qwen3.5-Flash في متوسط النتيجة بـ 6.8 مقابل 6.1. لدى Gemma 4 31B تكلفة benchmark أقل عند $0.004 مقابل $0.080. Gemma 4 31B أسرع عند 4.05s مقابل 63.29s، مع معدلات نجاح 47.6% مقابل 71.4%.

النموذج الموصى به: Gemma 4 31B - Its score stays close to the best score here (6.1 vs 6.8), while costing about 26.5x less than Qwen3.5-Flash.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-02

المقياس Gemma 4 31B Gemma 4 31B none الإصدار: 2026-04-02 متاح مجانًا Qwen3.5-Flash Qwen3.5-Flash medium الإصدار: 2026-02-24
النتيجة 6.1 6.8
الترتيب #101 #73
الموثوقية 10.0 10.0
الاتساق 10.0 8.1
اختبارات صحيحة
معدل النجاح لكل محاولة 47.6% 71.4%
اختبارات غير مستقرة 0 5
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 0.034 0.871
إجمالي التكلفة $0.004 $0.080
سعر الإدخال $0.120 / 1M $0.065 / 1M
سعر الإخراج $0.350 / 1M $0.260 / 1M
إجمالي رموز الإدخال 20,911 38,926
رموز الإخراج 1,407 2,088
رموز الاستدلال 0 294,598
زمن الاستجابة (المتوسط) 4.05s 63.29s
زمن الاستجابة (الحد الأقصى) 26.13s 234.29s
زمن الاستجابة (الإجمالي) 76.87s 1265.85s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#101 Gemma 4 31B

none
التكلفة
$0.001
الوقت
12.8s
الرموز
795 tok

#73 Qwen3.5-Flash

medium
التكلفة
$0.002
الوقت
25.8s
الرموز
4,294 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 6.5 10.0 50.0% 0 1.85s 852 45 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 672 383 32,992
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 5.5 10.0 33.3% 0 11.19s 8,381 735 0
Qwen3.5-Flash 3.7 7.2 22.2% 1 58.87s 6,685 302 90,081
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 14,934 483 8,270
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 10.0 10.0 100.0% 0 2.25s 8,352 285 0
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 6,061 235 16,237
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 7.7 10.0 66.7% 0 3.22s 903 27 0
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 581 58 43,615
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 10.0 10.0 100.0% 0 2.09s 576 117 0
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 516 99 38,486
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 6.5 10.0 50.0% 0 2.84s 795 78 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 699 98 14,139
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 6.5 10.0 33.3% 0 4.23s 828 108 0
Qwen3.5-Flash 8.2 7.2 88.9% 1 27.61s 381 89 12,457
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 8,193 309 1,284
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 31B 3.0 10.0 0.0% 0 1.25s 224 12 0
Qwen3.5-Flash 3.0 10.0 0.0% 0 48.98s 204 32 37,037

مقارنة سريعة

تبديل زوج المقارنة