التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Cobuddy vs Inception: Mercury 2

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-03

المقياس Cobuddy Cobuddy medium الإصدار: 2026-05-06 Mercury 2 Mercury 2 none الإصدار: 2026-02-24
النتيجة 5.8 4.6
الترتيب #116 #153
الموثوقية 10.0 10.0
الاتساق 7.4 9.1
اختبارات صحيحة
معدل النجاح لكل محاولة 50.0% 25.0%
اختبارات غير مستقرة 6 2
إجمالي مرات التشغيل 60 60
التكلفة لكل نتيجة 0.000 0.216
إجمالي التكلفة $0.000 $0.009
سعر الإدخال $0.000 / 1M $0.250 / 1M
سعر الإخراج $0.000 / 1M $0.750 / 1M
إجمالي رموز الإدخال 37,449 25,515
رموز الإخراج 1,677 3,001
رموز الاستدلال 116,703 0
زمن الاستجابة (المتوسط) 39.90s 614ms
زمن الاستجابة (الحد الأقصى) 309.02s 1.27s
زمن الاستجابة (الإجمالي) 797.98s 12.28s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Cobuddy 8.7 7.9 91.7% 1 10.00s 453 98 4,666
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Cobuddy 4.1 5.1 33.3% 1 79.17s 4,726 358 30,138
Mercury 2 3.5 9.4 0.0% 0 831ms 4,631 1,650 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Cobuddy 3.0 10.0 0.0% 0 47.38s 18,324 465 7,265
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Cobuddy 6.3 5.8 66.7% 1 17.36s 8,181 275 5,591
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Cobuddy 2.9 4.4 22.2% 2 128.15s 540 10 49,454
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Cobuddy 4.2 9.9 0.0% 0 23.23s 498 76 3,782
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Cobuddy 9.8 10.0 100.0% 0 11.60s 508 64 2,842
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Cobuddy 3.6 7.2 22.2% 1 12.83s 561 189 5,808
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Cobuddy 10.0 10.0 100.0% 0 11.19s 3,505 133 294
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Cobuddy 3.0 10.0 0.0% 0 36.98s 153 9 6,863
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0

مقارنة سريعة

تبديل زوج المقارنة