التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

Nemotron 3 Ultra 550b A55b vs OpenAI: gpt-oss-120b

الملخص

مقارنة benchmark بين Nemotron 3 Ultra 550b A55b و gpt-oss-120b: يتقدم Nemotron 3 Ultra 550b A55b في متوسط النتيجة بـ 6.1 مقابل 4.0. لدى gpt-oss-120b تكلفة benchmark أقل عند $0.010 مقابل $0.027. Nemotron 3 Ultra 550b A55b أسرع عند 2.27s مقابل 21.61s، مع معدلات نجاح 44.4% مقابل 34.9%.

النموذج الموصى به: Nemotron 3 Ultra 550b A55b - It has the best score here (6.1), while responding about 9.5x faster than gpt-oss-120b.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b none الإصدار: 2026-06-04 متاح مجانًا gpt-oss-120b gpt-oss-120b none الإصدار: 2025-08-05 متاح مجانًا
النتيجة 6.1 4.0
الترتيب #99 #164
الموثوقية 10.0 10.0
الاتساق 9.2 8.2
اختبارات صحيحة
معدل النجاح لكل محاولة 44.4% 34.9%
اختبارات غير مستقرة 2 2
إجمالي مرات التشغيل 63 57
التكلفة لكل نتيجة 0.000 0.168
إجمالي التكلفة $0.027 $0.010
سعر الإدخال $0.500 / 1M $0.039 / 1M
سعر الإخراج $2.200 / 1M $0.180 / 1M
إجمالي رموز الإدخال 43,326 9,081
رموز الإخراج 2,138 51,664
رموز الاستدلال 0 0
زمن الاستجابة (المتوسط) 2.27s 21.61s
زمن الاستجابة (الحد الأقصى) 13.49s 113.71s
زمن الاستجابة (الإجمالي) 47.65s 345.79s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#99 Nemotron 3 Ultra 550b A55b

none
التكلفة
$0.000
الوقت
149.6s
الرموز
3,405 tok

#164 gpt-oss-120b

none
لم يتم إنشاء نتيجة عرض لهذا النموذج بعد.
التكلفة
$0.000
الوقت
-
الرموز
0 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Nemotron 3 Ultra 550b A55b 3.5 8.0 16.7% 1 2.35s 696 239 0
gpt-oss-120b 6.5 10.0 50.0% 0 32.84s 1,336 8,676 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Nemotron 3 Ultra 550b A55b 5.5 10.0 33.3% 0 1.02s 7,623 369 0
gpt-oss-120b 1.5 4.0 22.2% 1 9.57s 901 3,232 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Nemotron 3 Ultra 550b A55b 3.0 10.0 0.0% 0 4.79s 15,558 357 0
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 1.94s 7,944 249 0
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 2,421 598 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Nemotron 3 Ultra 550b A55b 5.3 10.0 33.3% 0 698ms 789 27 0
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 1,294 29,483 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Nemotron 3 Ultra 550b A55b 5.0 10.0 0.0% 0 13.49s 516 101 0
gpt-oss-120b 4.8 10.0 0.0% 0 10.79s 584 615 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 1.46s 723 69 0
gpt-oss-120b 9.8 10.0 100.0% 0 5.06s 1,043 1,940 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Nemotron 3 Ultra 550b A55b 5.9 7.2 55.6% 1 1.06s 726 352 0
gpt-oss-120b 6.0 7.2 55.6% 1 8.21s 1,188 3,982 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 2.99s 8,544 264 0
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0 0
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Nemotron 3 Ultra 550b A55b 3.0 10.0 0.0% 0 1.83s 207 111 0
gpt-oss-120b 3.0 10.0 0.0% 0 47.29s 314 3,138 0

مقارنة سريعة

تبديل زوج المقارنة