#107

LFM2-24B-A2B

Liquid প্রকাশ: 2026-02-24 পরীক্ষিত হয়েছে: 2026-04-10 23:27 liquid/lfm-2-24b-a2b::none

সারাংশ

LFM2-24B-A2B AI BENCHY-তে 4.1 স্কোর করে এবং #107 স্থানে আছে। এর reliability প্রযোজ্য নয়, pass rate 14.6%, মোট খরচ $0.001, এবং গড় response time 811ms.

LFM2-24B-A2B কে আলাদা করে যা: এটি ডোমেইন-নির্দিষ্ট-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #4; আর ডেটা পার্সিং ও নিষ্কাশন এর দুর্বলতম ক্ষেত্র, rank #15. একই ধরনের মডেলের তুলনায় এটি লক্ষণীয়ভাবে দ্রুত।

আর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।

স্কোর

4.1

ধারাবাহিকতা

9.0

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট খরচ (বর্তমান মূল্য)

$0.001

মোট আউটপুট টোকেন

1,185

মোট ইনপুট টোকেন

ইনপুট মূল্য

$0.030 / 1M

আউটপুট মূল্য

$0.120 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 15

প্রতি চেষ্টায় পাস রেট: 14.6%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

811ms

প্রতিক্রিয়া সময় (সর্বোচ্চ): 2.88s

প্রতিক্রিয়া সময় (মোট): 11.35s

ভুল উত্তর: 9 API ত্রুটি: 4 নির্দেশনা অনুসরণ করা হয়নি: 2

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#107 LiquidAI: LFM2-24B-A2B

none

অবৈধ SVG

খরচ: $0.000
সময়: 300.0s
টোকেন: 0 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-05-06 14:04 পুনরায় পরীক্ষা	4.2	প্রযোজ্য নয়	$0.001	তুলনা করুন
2026-05-06 14:04 পুনরায় পরীক্ষা	4.2	প্রযোজ্য নয়	$0.001	তুলনা করুন
2026-05-06 14:04 স্যুইট পরিবর্তিত হয়েছে	4.2	প্রযোজ্য নয়	$0.001	তুলনা করুন
2026-04-10 23:27 প্রথম নথিভুক্ত রান	4.1	প্রযোজ্য নয়	$0.001	বর্তমান রান

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-04-10 23:27 · প্রথম নথিভুক্ত রান	4.1	9.0	প্রযোজ্য নয়	1/16	2	1,185	$0.001	811ms
2026-05-06 14:04 · স্যুইট পরিবর্তিত হয়েছে	4.2	9.0	প্রযোজ্য নয়	2/16	2	1,185	$0.001	811ms
পার্থক্য	-0.1	0.0		-1	0	0	$0.000	0ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

LFM2-24B-A2BnonevsGemini 3.5 Flashhigh LFM2-24B-A2BnonevsGemini 3 Flash Previewmedium LFM2-24B-A2BnonevsNemotron 3 Ultra 550b A55bmediumবিনামূল্যে উপলভ্য LFM2-24B-A2BnonevsGPT-5.5low

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	3.3	9.8
সমন্বিত	3.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	3.0	10.0
ডোমেইন-নির্দিষ্ট	5.9	7.2
Sadharon Buddhimotta	4.0	10.0
নির্দেশনা অনুসরণ	4.8	10.0
ধাঁধা সমাধান	4.4	7.9
টুল কলিং	3.0	10.0

LFM2-24B-A2B

Hamster playing table tennis

#107 LiquidAI: LFM2-24B-A2B

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল