التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.6 Flash vs StepFun: Step 3.7 Flash

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-04

المقياس Qwen3.6 Flash Qwen3.6 Flash medium الإصدار: 2026-04-20 Step 3.7 Flash Step 3.7 Flash low الإصدار: 2026-05-29
النتيجة 7.5 7.3
الترتيب #39 #57
الموثوقية 10.0 10.0
الاتساق 8.1 8.4
اختبارات صحيحة
معدل النجاح لكل محاولة 71.4% 68.3%
اختبارات غير مستقرة 5 4
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 3.030 2.840
إجمالي التكلفة $0.288 $0.341
سعر الإدخال $0.188 / 1M $0.200 / 1M
سعر الإخراج $1.125 / 1M $1.150 / 1M
إجمالي رموز الإدخال 42,362 40,101
رموز الإخراج 2,995 289,325
رموز الاستدلال 245,358 0
زمن الاستجابة (المتوسط) 19.25s 15.74s
زمن الاستجابة (الحد الأقصى) 122.87s 124.75s
زمن الاستجابة (الإجمالي) 404.20s 330.63s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.10s 672 624 14,024
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 756 10,896 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.6 Flash 5.0 5.1 44.5% 2 42.85s 7,895 495 67,967
Step 3.7 Flash 8.2 7.2 88.9% 1 9.46s 7,437 18,685 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.6 Flash 10.0 10.0 100.0% 0 20.28s 14,934 483 13,839
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 13,683 6,426 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.6 Flash 10.0 10.0 100.0% 0 9.65s 7,782 270 13,155
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 7,398 2,667 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.6 Flash 3.5 4.4 33.3% 2 14.65s 771 60 24,409
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 828 104,487 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.6 Flash 4.8 9.9 0.0% 0 9.88s 516 140 5,445
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 525 4,604 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.05s 699 102 7,423
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 735 1,857 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.6 Flash 8.2 7.2 88.9% 1 6.29s 696 460 10,860
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 756 3,564 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.6 Flash 10.0 10.0 100.0% 0 4.00s 8,193 335 1,188
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 7,746 1,360 0
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Qwen3.6 Flash 3.0 10.0 0.0% 0 122.87s 204 26 87,048
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 237 134,779 0

مقارنة سريعة

تبديل زوج المقارنة