التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

Trinity Large Preview vs Qwen: Qwen3.5-9B

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-22

المقياس Trinity Large Preview Trinity Large Preview none الإصدار: 2026-01-27 Qwen3.5-9B Qwen3.5-9B medium الإصدار: 2026-03-02
النتيجة 4.8 4.2
الترتيب #140 #151
الموثوقية 10.0 1.7
الاتساق 8.9 7.0
اختبارات صحيحة
معدل النجاح لكل محاولة 26.3% 31.7%
اختبارات غير مستقرة 3 7
إجمالي مرات التشغيل 60 60
التكلفة لكل نتيجة 0.017 1.140
إجمالي التكلفة $0.001 $0.035
??? ??????? $0.000 / 1M $0.040 / 1M
??? ??????? $0.000 / 1M $0.150 / 1M
رموز الإخراج 2,190 27,365
رموز الاستدلال 0 202,291
زمن الاستجابة (المتوسط) 3.03s 80.10s
زمن الاستجابة (الحد الأقصى) 14.34s 226.38s
زمن الاستجابة (الإجمالي) 57.60s 1281.62s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Trinity Large Preview 3.1 10.0 0.0% 0 2.07s 550 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 2,621 12,411
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Trinity Large Preview 4.9 3.2 33.3% 1 14.34s 397 0
Qwen3.5-9B 2.8 10.0 0.0% 0 135.61s 6,150 31,393
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 294 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 186 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 1,383 32,113
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 25 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 11,549 48,475
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Trinity Large Preview 4.5 10.0 0.0% 0 873ms 104 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 0 30,695
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Trinity Large Preview 3.4 6.2 16.7% 1 1.09s 63 0
Qwen3.5-9B 6.4 5.8 66.7% 1 17.15s 599 4,517
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Trinity Large Preview 3.6 7.7 11.1% 1 2.13s 286 0
Qwen3.5-9B 2.9 7.2 11.1% 1 33.38s 1,545 11,844
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 444 1,149
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Trinity Large Preview 3.0 10.0 0.0% 0 777ms 18 0
Qwen3.5-9B 3.0 10.0 0.0% 0 177.02s 3,074 29,694

مقارنة سريعة

تبديل زوج المقارنة