AI BENCHY
قارن الرسوم البيانية
❤️ XCS
Your ad here

#39

LiquidAI: LFM2-24B-A2B

Liquid · liquid/lfm-2-24b-a2b::none

افتح محدد مقارنة النماذج

متوسط الدرجة

2.43

التكلفة لكل نتيجة

0.045

الاتساق

8.91

إجمالي التكلفة

$0.001

اختبارات صحيحة

1/14

يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.

الاختبارات الخاطئة

13

معدل النجاح لكل محاولة: 16.7%

اختبارات غير مستقرة

2

زمن الاستجابة: المتوسط 851ms · الإجمالي 11.07s · الحد الأقصى 2.88s

إجابة خاطئة: 8 خطأ API: 3 لم يتبع التعليمات: 2

أفضل النماذج حسب الدرجة

اختر النموذج الأول، ثم انقر على نموذج ثانٍ لفتح صفحة مقارنة جنبًا إلى جنب.

تفصيل الفئات

الفئة متوسط الدرجة الاتساق اختبارات صحيحة
Anti-AI Tricks 1.00 9.82 0/3
Data parsing and extraction 1.00 10.00 0/2
Domain specific 4.00 7.21 1/3
Instructions following 3.00 10.00 0/2
Puzzle Solving 3.34 7.89 0/3
Tool Calling 1.00 10.00 0/1