التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Nemotron 3 Super 120b A12b vs Z.ai: GLM 4.7 Flash

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-12

المقياس Nemotron 3 Super 120b A12b Nemotron 3 Super 120b A12b none الإصدار: 2026-03-11 متاح مجانًا GLM 4.7 Flash GLM 4.7 Flash medium الإصدار: 2026-01-19
الترتيب #59 #62
متوسط الدرجة 3.4 3.1
الاتساق 8.6 6.4
التكلفة لكل نتيجة 0.000 1.040
إجمالي التكلفة $0.000 $0.042
اختبارات صحيحة
معدل النجاح لكل محاولة 31.3% 41.7%
اختبارات غير مستقرة 3 7
إجمالي مرات التشغيل 48 48
رموز الإخراج 4,222 38,682
رموز الاستدلال 0 64,952
زمن الاستجابة (المتوسط) 8.90s 36.84s
زمن الاستجابة (الحد الأقصى) 24.97s 174.55s
زمن الاستجابة (الإجمالي) 142.40s 331.58s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

متوسط الدرجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

متوسط الدرجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Nemotron 3 Super 120b A12b 10.0 10.0 0.0% 0 7.14s 2,171 0
GLM 4.7 Flash 4.0 4.5 55.6% 2 27.09s 1,085 5,597
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Nemotron 3 Super 120b A12b 10.0 10.0 0.0% 0 19.98s 124 0
GLM 4.7 Flash 10.0 2.1 33.3% 1 65.57s 2,585 20,648
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Nemotron 3 Super 120b A12b 9.9 10.0 100.0% 0 7.92s 249 0
GLM 4.7 Flash 5.0 10.0 50.0% 0 1.51s 584 2,755
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Nemotron 3 Super 120b A12b 10.0 7.2 22.2% 1 6.23s 26 0
GLM 4.7 Flash 10.0 4.4 33.3% 2 174.55s 33,000 25,394
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Nemotron 3 Super 120b A12b 3.0 9.9 0.0% 0 24.97s 170 0
GLM 4.7 Flash 10.0 9.7 0.0% 0 18.14s 18 2,138
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Nemotron 3 Super 120b A12b 4.5 6.9 33.3% 1 1.50s 66 0
GLM 4.7 Flash 5.0 5.8 66.7% 1 2.97s 388 2,181
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Nemotron 3 Super 120b A12b 4.7 10.0 33.3% 0 7.50s 1,135 0
GLM 4.7 Flash 10.0 7.2 11.1% 1 12.90s 798 5,225
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Nemotron 3 Super 120b A12b 10.0 1.6 66.7% 1 16.00s 281 0
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 224 1,014

مقارنة سريعة

تبديل زوج المقارنة