AI BENCHY
Advertise here

#107

LFM2-24B-A2B

Liquid প্রকাশ: 2026-02-24 পরীক্ষিত হয়েছে: 2026-04-10 23:27 liquid/lfm-2-24b-a2b::none

আর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।

ধারাবাহিকতা

9.0

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট আউটপুট টোকেন

1,185

ইনপুট মূল্য

$0.030 / 1M

আউটপুট মূল্য

$0.120 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 15

প্রতি চেষ্টায় পাস রেট: 14.6%

অস্থির টেস্ট

2

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

811ms

প্রতিক্রিয়া সময় (সর্বোচ্চ): 2.88s

প্রতিক্রিয়া সময় (মোট): 11.35s

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-05-06 14:04 পুনরায় পরীক্ষা 4.2 প্রযোজ্য নয় $0.001 তুলনা করুন
2026-05-06 14:04 স্যুইট পরিবর্তিত হয়েছে 4.2 প্রযোজ্য নয় $0.001 তুলনা করুন
2026-04-10 23:27 প্রথম নথিভুক্ত রান 4.1 প্রযোজ্য নয় $0.001 বর্তমান রান

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-04-10 23:27 · প্রথম নথিভুক্ত রান4.19.0প্রযোজ্য নয়1/1621,185$0.001811ms
2026-05-06 14:04 · স্যুইট পরিবর্তিত হয়েছে4.29.0প্রযোজ্য নয়2/1621,185$0.001811ms
পার্থক্য-0.10.0-100$0.0000ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 3.3 9.8
সমন্বিত 3.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 3.0 10.0
ডোমেইন-নির্দিষ্ট 5.9 7.2
Sadharon Buddhimotta 4.0 10.0
নির্দেশনা অনুসরণ 4.8 10.0
ধাঁধা সমাধান 4.4 7.9
টুল কলিং 3.0 10.0

তুলনা করা মডেল