التنقل
AI BENCHY
Your ad here

AI BENCHY Compare

Nemotron 3 Super 120b A12b vs OpenAI: GPT-5.2 Chat

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-17

المقياس Nemotron 3 Super 120b A12b Nemotron 3 Super 120b A12b medium الإصدار: 2026-03-11 متاح مجانًا GPT-5.2 Chat GPT-5.2 Chat none الإصدار: 2025-12-11
الترتيب #37 #24
النتيجة 6.9 7.8
الاتساق 8.6 8.6
التكلفة لكل نتيجة 0.000 2.462
إجمالي التكلفة $0.000 $0.271
اختبارات صحيحة
معدل النجاح لكل محاولة 58.8% 74.5%
اختبارات غير مستقرة 3 3
إجمالي مرات التشغيل 49 51
رموز الإخراج 11,947 16,001
رموز الاستدلال 29,768 0
زمن الاستجابة (المتوسط) 19.06s 6.72s
زمن الاستجابة (الحد الأقصى) 87.80s 38.52s
زمن الاستجابة (الإجمالي) 305.04s 114.20s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 10.08s 1,776 3,345
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 1,807 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 87.80s 2,021 9,996
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 18.16s 877 2,607
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 980 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Nemotron 3 Super 120b A12b 2.9 4.4 22.2% 2 16.19s 5,255 6,072
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 7,810 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Nemotron 3 Super 120b A12b 3.8 9.9 0.0% 0 27.86s 104 1,149
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 335 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Nemotron 3 Super 120b A12b 7.2 6.5 66.7% 1 7.72s 1,042 2,479
GPT-5.2 Chat 7.5 6.1 83.3% 1 5.46s 1,528 0
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Nemotron 3 Super 120b A12b 3.5 9.8 0.0% 0 8.39s 602 2,151
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.42s 1,743 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 39.75s 270 1,969
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0

مقارنة سريعة

تبديل زوج المقارنة