التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

Cobuddy vs Inception: Mercury 2

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-22

المقياس Cobuddy Cobuddy medium الإصدار: 2026-05-06 متاح مجانًا Mercury 2 Mercury 2 medium الإصدار: 2026-02-24
النتيجة 5.7 6.3
الترتيب #105 #90
الموثوقية 9.9 10.0
الاتساق 7.0 8.4
اختبارات صحيحة
معدل النجاح لكل محاولة 51.7% 50.0%
اختبارات غير مستقرة 7 4
إجمالي مرات التشغيل 60 60
التكلفة لكل نتيجة 0.000 0.687
إجمالي التكلفة $0.000 $0.055
??? ??????? $0.000 / 1M $0.250 / 1M
??? ??????? $0.000 / 1M $0.750 / 1M
رموز الإخراج 1,663 4,015
رموز الاستدلال 116,522 58,382
زمن الاستجابة (المتوسط) 39.91s 2.27s
زمن الاستجابة (الحد الأقصى) 309.02s 14.63s
زمن الاستجابة (الإجمالي) 798.21s 43.15s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Cobuddy 8.7 7.9 91.7% 1 10.00s 98 4,666
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Cobuddy 4.1 5.1 33.3% 1 79.17s 358 30,138
Mercury 2 7.2 6.5 66.7% 1 2.29s 270 8,514
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Cobuddy 3.0 10.0 0.0% 0 47.38s 465 7,265
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Cobuddy 6.3 5.8 66.7% 1 17.36s 275 5,591
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Cobuddy 2.9 4.4 22.2% 2 128.15s 10 49,454
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Cobuddy 4.2 9.9 0.0% 0 23.23s 76 3,782
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Cobuddy 9.8 10.0 100.0% 0 11.60s 64 2,842
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Cobuddy 3.5 4.4 33.3% 2 12.91s 175 5,627
Mercury 2 3.8 7.3 22.2% 1 934ms 354 2,758
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Cobuddy 10.0 10.0 100.0% 0 11.19s 133 294
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Cobuddy 3.0 10.0 0.0% 0 36.98s 9 6,863
Mercury 2 3.0 10.0 0.0% 0 2.58s 22 3,748

مقارنة سريعة

تبديل زوج المقارنة