مقارنة benchmark بين Nemotron 3 Ultra 550b A55b و Hunter Alpha: يتقدم Nemotron 3 Ultra 550b A55b في متوسط النتيجة بـ 7.5 مقابل 5.7. لدى Hunter Alpha تكلفة benchmark أقل عند $0.000 مقابل $0.177. Hunter Alpha أسرع عند 4.70s مقابل 15.05s، مع معدلات نجاح 69.8% مقابل 46.3%.
النموذج الموصى به: Nemotron 3 Ultra 550b A55b - It has the strongest score in this comparison (7.5) and the best overall balance of cost and response time across all 2 models.
تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-10
Hunter AlphaHunter Alphanoneنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.الإصدار: 2026-03-11
النتيجة
7.5متوسط الدرجة عبر جميع اختبارات القياس.…
5.7متوسط الدرجة عبر جميع اختبارات القياس.…
الترتيب
#42
#117
الموثوقية
9.7درجة النجاح من المحاولة الأولى: 10.0 تعني عدم وجود إخفاقات قابلة لإعادة المحاولة من واجهة API الهدف أو حدود المعدل قبل النداءات الناجحة؛ الإخفاقات المسجلة تخفض الدرجة.…
غير متاحدرجة النجاح من المحاولة الأولى: 10.0 تعني عدم وجود إخفاقات قابلة لإعادة المحاولة من واجهة API الهدف أو حدود المعدل قبل النداءات الناجحة؛ الإخفاقات المسجلة تخفض الدرجة.…
الاتساق
8.8تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
8.2تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
اختبارات صحيحة
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 7خطأ API: 1زمن الاستجابة (المتوسط)15.05sزمن الاستجابة (الحد الأقصى)43.93sزمن الاستجابة (الإجمالي)316.09sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 9لم يتبع التعليمات: 2خطأ API: 1زمن الاستجابة (المتوسط)4.70sزمن الاستجابة (الحد الأقصى)15.17sزمن الاستجابة (الإجمالي)79.86sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
معدل النجاح لكل محاولة
69.8%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
46.3%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
اختبارات غير مستقرة
3الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
4الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
إجمالي مرات التشغيل
63إجمالي مرات التشغيل…
52إجمالي مرات التشغيل…
التكلفة لكل نتيجة
0.000يعرض متوسط التكلفة لكل إجابة صحيحة في المعيار بالسنت (الأقل أفضل).…
0.000يعرض متوسط التكلفة لكل إجابة صحيحة في المعيار بالسنت (الأقل أفضل).…
إجمالي التكلفة
$0.177إجمالي التكلفة (السعر الحالي)…
$0.000إجمالي التكلفة (السعر الحالي)…
سعر الإدخال
$0.500 / 1Mسعر الإدخال…
$0.000 / 1Mسعر الإدخال…
سعر الإخراج
$2.500 / 1Mسعر الإخراج…
$0.000 / 1Mسعر الإخراج…
إجمالي رموز الإدخال
46,813إجمالي رموز الإدخال…
34,329إجمالي رموز الإدخال…
رموز الإخراج
18,002رموز الإخراج…
2,264رموز الإخراج…
رموز الاستدلال
53,091رموز الاستدلال…
0رموز الاستدلال…
زمن الاستجابة (المتوسط)
15.05sزمن الاستجابة (المتوسط)…
4.70sزمن الاستجابة (المتوسط)…
زمن الاستجابة (الحد الأقصى)
43.93sزمن الاستجابة (الحد الأقصى)…
15.17sزمن الاستجابة (الحد الأقصى)…
زمن الاستجابة (الإجمالي)
316.09sزمن الاستجابة (الإجمالي)…
79.86sزمن الاستجابة (الإجمالي)…
Generation showcase
Hamster playing table tennis
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
#42 Nemotron 3 Ultra 550b A55b
medium
No showcase result has been generated for this model yet.
Cost
$0.000
Time
-
Tokens
0 tok
#117 Hunter Alpha
none
Hunter Alpha was a stealth model revealed on March 18th as an early testing version of MiMo-V2-Pro. Find it here: https://openrouter.ai/xiaomi/mimo-v2-pro
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)8.62sزمن الاستجابة (الحد الأقصى)16.86sزمن الاستجابة (الإجمالي)34.49sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
8.62sزمن الاستجابة (المتوسط)…
780إجمالي رموز الإدخال…
835رموز الإخراج…
1,485رموز الاستدلال…
Hunter Alphaنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
3.5متوسط الدرجة عبر جميع اختبارات القياس.…
8.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
16.7%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
1الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 4زمن الاستجابة (المتوسط)3.81sزمن الاستجابة (الحد الأقصى)6.85sزمن الاستجابة (الإجمالي)15.23sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
7.4تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
88.9%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
1الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)26.53sزمن الاستجابة (الحد الأقصى)31.91sزمن الاستجابة (الإجمالي)79.58sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
26.53sزمن الاستجابة (المتوسط)…
7,686إجمالي رموز الإدخال…
2,854رموز الإخراج…
17,725رموز الاستدلال…
Hunter Alphaنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
3.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1زمن الاستجابة (المتوسط)0msزمن الاستجابة (الحد الأقصى)0msزمن الاستجابة (الإجمالي)0msيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)43.93sزمن الاستجابة (الحد الأقصى)43.93sزمن الاستجابة (الإجمالي)43.93sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
43.93sزمن الاستجابة (المتوسط)…
17,574إجمالي رموز الإدخال…
1,040رموز الإخراج…
3,590رموز الاستدلال…
Hunter Alphaنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
3.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)15.17sزمن الاستجابة (الحد الأقصى)15.17sزمن الاستجابة (الإجمالي)15.17sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)5.68sزمن الاستجابة (الحد الأقصى)7.94sزمن الاستجابة (الإجمالي)11.36sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
5.68sزمن الاستجابة (المتوسط)…
7,989إجمالي رموز الإدخال…
473رموز الإخراج…
1,285رموز الاستدلال…
Hunter Alphaنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)8.49sزمن الاستجابة (الحد الأقصى)14.02sزمن الاستجابة (الإجمالي)16.98sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
4.4تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
33.3%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
2الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 3زمن الاستجابة (المتوسط)24.90sزمن الاستجابة (الحد الأقصى)34.96sزمن الاستجابة (الإجمالي)74.71sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
24.90sزمن الاستجابة (المتوسط)…
858إجمالي رموز الإدخال…
11,169رموز الإخراج…
16,249رموز الاستدلال…
Hunter Alphaنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
5.3متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
33.3%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2زمن الاستجابة (المتوسط)2.33sزمن الاستجابة (الحد الأقصى)2.94sزمن الاستجابة (الإجمالي)6.99sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
9.5تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1زمن الاستجابة (المتوسط)2.52sزمن الاستجابة (الحد الأقصى)2.52sزمن الاستجابة (الإجمالي)2.52sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
2.52sزمن الاستجابة (المتوسط)…
360إجمالي رموز الإدخال…
70رموز الإخراج…
235رموز الاستدلال…
Hunter Alphaنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
6.1متوسط الدرجة عبر جميع اختبارات القياس.…
3.1تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
66.7%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
1الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)2.71sزمن الاستجابة (الحد الأقصى)2.71sزمن الاستجابة (الإجمالي)2.71sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)6.35sزمن الاستجابة (الحد الأقصى)9.38sزمن الاستجابة (الإجمالي)12.69sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
6.35sزمن الاستجابة (المتوسط)…
765إجمالي رموز الإدخال…
182رموز الإخراج…
1,243رموز الاستدلال…
Hunter Alphaنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
6.4متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
50.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)2.82sزمن الاستجابة (الحد الأقصى)2.92sزمن الاستجابة (الإجمالي)5.65sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
9.9تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
33.3%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2زمن الاستجابة (المتوسط)3.54sزمن الاستجابة (الحد الأقصى)6.03sزمن الاستجابة (الإجمالي)10.62sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
3.54sزمن الاستجابة (المتوسط)…
792إجمالي رموز الإدخال…
771رموز الإخراج…
2,055رموز الاستدلال…
Hunter Alphaنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
5.8متوسط الدرجة عبر جميع اختبارات القياس.…
4.4تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
66.7%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
2الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1إجابة خاطئة: 1زمن الاستجابة (المتوسط)3.71sزمن الاستجابة (الحد الأقصى)5.43sزمن الاستجابة (الإجمالي)11.13sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)7.72sزمن الاستجابة (الحد الأقصى)7.72sزمن الاستجابة (الإجمالي)7.72sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
7.72sزمن الاستجابة (المتوسط)…
9,781إجمالي رموز الإدخال…
304رموز الإخراج…
984رموز الاستدلال…
Hunter Alphaنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)6.02sزمن الاستجابة (الحد الأقصى)6.02sزمن الاستجابة (الإجمالي)6.02sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)38.47sزمن الاستجابة (الحد الأقصى)38.47sزمن الاستجابة (الإجمالي)38.47sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
38.47sزمن الاستجابة (المتوسط)…
228إجمالي رموز الإدخال…
304رموز الإخراج…
8,240رموز الاستدلال…
Hunter Alphaنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.