#150

LFM2-24B-A2B

Liquid প্রকাশ: 2026-02-24 পরীক্ষিত হয়েছে: 2026-05-06 14:04 liquid/lfm-2-24b-a2b::none

সারাংশ

LFM2-24B-A2B AI BENCHY-তে 4.2 স্কোর করে এবং #150 স্থানে আছে। এর reliability প্রযোজ্য নয়, pass rate 18.8%, মোট খরচ $0.001, এবং গড় response time 811ms.

LFM2-24B-A2B কে আলাদা করে যা: এটি ডোমেইন-নির্দিষ্ট-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #1; আর ডেটা পার্সিং ও নিষ্কাশন এর দুর্বলতম ক্ষেত্র, rank #15. এই score range-এর জন্য মোট benchmark খরচ অস্বাভাবিকভাবে কম।

আর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।

স্কোর

4.2

ধারাবাহিকতা

9.0

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট খরচ (বর্তমান মূল্য)

$0.001

মোট আউটপুট টোকেন

1,185

মোট ইনপুট টোকেন

ইনপুট মূল্য

$0.030 / 1M

আউটপুট মূল্য

$0.120 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 14

প্রতি চেষ্টায় পাস রেট: 18.8%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

811ms

প্রতিক্রিয়া সময় (সর্বোচ্চ): 2.88s

প্রতিক্রিয়া সময় (মোট): 11.35s

ভুল উত্তর: 8 API ত্রুটি: 4 নির্দেশনা অনুসরণ করা হয়নি: 2

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#150 LiquidAI: LFM2-24B-A2B

none

অবৈধ SVG

খরচ: $0.000
সময়: 300.0s
টোকেন: 0 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-05-06 14:04 পুনরায় পরীক্ষা	4.2	প্রযোজ্য নয়	$0.001	তুলনা করুন
2026-05-06 14:04 পুনরায় পরীক্ষা	4.2	প্রযোজ্য নয়	$0.001	তুলনা করুন
2026-05-06 14:04 স্যুইট পরিবর্তিত হয়েছে	4.2	প্রযোজ্য নয়	$0.001	বর্তমান রান
2026-04-10 23:27 প্রথম নথিভুক্ত রান	4.1	প্রযোজ্য নয়	$0.001	তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-05-06 14:04 · স্যুইট পরিবর্তিত হয়েছে	4.2	9.0	প্রযোজ্য নয়	2/16	2	1,185	$0.001	811ms
2026-04-10 23:27 · প্রথম নথিভুক্ত রান	4.1	9.0	প্রযোজ্য নয়	1/16	2	1,185	$0.001	811ms
পার্থক্য	+0.1	0.0		+1	0	0	$0.000	0ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

LFM2-24B-A2BnonevsGemini 3.5 Flashhigh LFM2-24B-A2BnonevsGemini 3 Flash Previewmedium LFM2-24B-A2BnonevsNemotron 3 Ultra 550b A55bmediumবিনামূল্যে উপলভ্য LFM2-24B-A2BnonevsGPT-5.5low

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	3.3	9.8
সমন্বিত	3.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	3.0	10.0
ডোমেইন-নির্দিষ্ট	5.9	7.2
Sadharon Buddhimotta	4.0	10.0
নির্দেশনা অনুসরণ	6.3	10.0
ধাঁধা সমাধান	3.7	7.7
টুল কলিং	3.0	10.0

LFM2-24B-A2B

Hamster playing table tennis

#150 LiquidAI: LFM2-24B-A2B

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল