التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

Inception: Mercury 2 vs NVIDIA: Nemotron 3 Super

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-03

المقياس Mercury 2 Mercury 2 none الإصدار: 2026-02-24 Nemotron 3 Super Nemotron 3 Super medium الإصدار: 2026-03-11 متاح مجانًا
النتيجة 4.6 5.9
الترتيب #153 #102
الموثوقية 10.0 10.0
الاتساق 9.1 9.2
اختبارات صحيحة
معدل النجاح لكل محاولة 25.0% 43.3%
اختبارات غير مستقرة 2 2
إجمالي مرات التشغيل 60 60
التكلفة لكل نتيجة 0.216 0.004
إجمالي التكلفة $0.009 $0.019
سعر الإدخال $0.250 / 1M $0.090 / 1M
سعر الإخراج $0.750 / 1M $0.450 / 1M
إجمالي رموز الإدخال 25,515 36,614
رموز الإخراج 3,001 14,505
رموز الاستدلال 0 30,178
زمن الاستجابة (المتوسط) 614ms 20.87s
زمن الاستجابة (الحد الأقصى) 1.27s 87.80s
زمن الاستجابة (الإجمالي) 12.28s 375.66s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
Nemotron 3 Super 8.3 10.0 75.0% 0 7.85s 686 748 1,305
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 3.5 9.4 0.0% 0 831ms 4,631 1,650 0
Nemotron 3 Super 3.1 9.9 0.0% 0 62.38s 1,362 452 848
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
Nemotron 3 Super 10.0 10.0 100.0% 0 87.80s 15,561 2,021 9,996
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
Nemotron 3 Super 10.0 10.0 100.0% 0 18.16s 7,944 877 2,607
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
Nemotron 3 Super 2.9 4.4 22.2% 2 16.19s 456 5,255 6,072
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
Nemotron 3 Super 4.1 10.0 0.0% 0 6.91s 492 105 363
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
Nemotron 3 Super 7.3 10.0 50.0% 0 6.97s 723 956 2,383
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
Nemotron 3 Super 3.0 10.0 0.0% 0 3.15s 708 570 1,322
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
Nemotron 3 Super 10.0 10.0 100.0% 0 39.75s 8,544 270 1,969
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0
Nemotron 3 Super 3.0 10.0 0.0% 0 55.32s 138 3,251 3,313

مقارنة سريعة

تبديل زوج المقارنة