AI BENCHY
قارن الرسوم البيانية المنهجية
❤️ Made by XCS
Your ad here

#45

Trinity Large Preview

Arcee AI · الإصدار: 2026-01-27 · arcee-ai/trinity-large-preview::none

التكلفة لكل نتيجة

0.000

الاتساق

9.6

اختبارات صحيحة

الاختبارات الخاطئة: 11

معدل النجاح لكل محاولة: 33.3%

اختبارات غير مستقرة

1

الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).

زمن الاستجابة (المتوسط)

3.15s

زمن الاستجابة (الحد الأقصى): 8.91s

زمن الاستجابة (الإجمالي): 50.46s

إجابة خاطئة: 9 لم يتبع التعليمات: 2

الرسوم البيانية

اختر النموذج الأول، ثم انقر على نموذج ثانٍ لفتح صفحة مقارنة جنبًا إلى جنب.

مقارنة سريعة

تفصيل الفئات

الفئة متوسط الدرجة الاتساق اختبارات صحيحة
Anti-AI Tricks 10.0 10.0
Combined 10.0 10.0
Data parsing and extraction 9.9 10.0
Domain specific 4.0 10.0
General Intelligence 3.0 9.9
Instructions following 3.5 6.7
Puzzle Solving 4.0 10.0
Tool Calling 10.0 10.0