التنقل
AI BENCHY
Your ad here

AI BENCHY Compare

Inception: Mercury 2 vs Qwen: Qwen3.5-9B

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-12

المقياس Mercury 2 Mercury 2 none الإصدار: 2026-02-24 Qwen3.5-9B Qwen3.5-9B none الإصدار: 2026-03-02
الترتيب #61 #60
متوسط الدرجة 3.4 3.4
الاتساق 9.0 10.0
التكلفة لكل نتيجة 0.153 0.111
إجمالي التكلفة $0.007 $0.005
اختبارات صحيحة
معدل النجاح لكل محاولة 31.3% 25.0%
اختبارات غير مستقرة 2 0
إجمالي مرات التشغيل 48 48
رموز الإخراج 1,303 2,939
رموز الاستدلال 0 0
زمن الاستجابة (المتوسط) 596ms 1.06s
زمن الاستجابة (الحد الأقصى) 1.27s 5.91s
زمن الاستجابة (الإجمالي) 9.54s 16.95s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

متوسط الدرجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

متوسط الدرجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mercury 2 10.0 10.0 0.0% 0 466ms 274 0
Qwen3.5-9B 10.0 9.9 0.0% 0 1.02s 576 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mercury 2 10.0 10.0 0.0% 0 606ms 131 0
Qwen3.5-9B 10.0 10.0 0.0% 0 5.91s 1,255 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mercury 2 5.5 5.9 83.3% 1 667ms 180 0
Qwen3.5-9B 9.9 10.0 100.0% 0 847ms 249 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mercury 2 4.0 7.2 44.4% 1 534ms 46 0
Qwen3.5-9B 10.0 10.0 0.0% 0 464ms 24 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mercury 2 4.0 10.0 0.0% 0 628ms 159 0
Qwen3.5-9B 3.0 9.9 0.0% 0 552ms 99 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mercury 2 5.5 10.0 50.0% 0 551ms 82 0
Qwen3.5-9B 5.5 10.0 50.0% 0 514ms 75 0
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mercury 2 10.0 10.0 0.0% 0 533ms 234 0
Qwen3.5-9B 10.0 9.9 0.0% 0 683ms 388 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
Qwen3.5-9B 10.0 10.0 100.0% 0 1.27s 273 0

مقارنة سريعة

تبديل زوج المقارنة