#84

Ling-2.6-flash

Inclusionai প্রকাশ: 2026-04-21 পরীক্ষিত হয়েছে: 2026-04-22 12:55 inclusionai/ling-2.6-flash::none

সারাংশ

Ling-2.6-flash AI BENCHY-তে 5.4 স্কোর করে এবং #84 স্থানে আছে। এর reliability প্রযোজ্য নয়, pass rate 35.2%, মোট খরচ $0.000, এবং গড় response time 11.33s.

Ling-2.6-flash কে আলাদা করে যা: এটি কোডিং-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #1; আর ডেটা পার্সিং ও নিষ্কাশন এর দুর্বলতম ক্ষেত্র, rank #18. এই score range-এর জন্য মোট benchmark খরচ অস্বাভাবিকভাবে কম।

স্কোর

5.4

ধারাবাহিকতা

9.5

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট খরচ (বর্তমান মূল্য)

$0.000

মোট আউটপুট টোকেন

3,338

মোট ইনপুট টোকেন

ইনপুট মূল্য

$0.000 / 1M

আউটপুট মূল্য

$0.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 12

প্রতি চেষ্টায় পাস রেট: 35.2%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

11.33s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 35.34s

প্রতিক্রিয়া সময় (মোট): 203.88s

ভুল উত্তর: 7 নির্দেশনা অনুসরণ করা হয়নি: 3 অবৈধ টুল কল: 2

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#84 Ling 2.6 Flash

none

Ling-2.6-flash is no longer available as a free model. It has transitioned to a paid model. Continue using it here: https://openrouter.ai/inclusionai/ling-2.6-flash

খরচ: $0.000
সময়: 0.0s
টোকেন: 0 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-07-16 23:16 নতুন টেস্ট যোগ হয়েছে	4.9	10.0	$0.002 ↑	তুলনা করুন
2026-06-04 14:30 নতুন টেস্ট যোগ হয়েছে	5.0	10.0	$0.001 ↑	তুলনা করুন
2026-05-22 00:42 স্যুইট পরিবর্তিত হয়েছে	5.3	10.0	$0.001	তুলনা করুন
2026-05-08 15:30 স্যুইট পরিবর্তিত হয়েছে	5.3	10.0	$0.001	তুলনা করুন
2026-04-22 12:55 প্রথম নথিভুক্ত রান	5.4	প্রযোজ্য নয়	$0.000	বর্তমান রান

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-04-22 12:55 · প্রথম নথিভুক্ত রান	5.4	9.5	প্রযোজ্য নয়	6/18	1	3,338	$0.000	11.33s
2026-05-08 15:30 · স্যুইট পরিবর্তিত হয়েছে	5.3	9.2	10.0	6/19	2	2,878	$0.001	9.76s
পার্থক্য	+0.1	+0.3		0	-1	+460	-$0.001	+1570ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	6.5	10.0
কোডিং	10.0	10.0
সমন্বিত	3.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	6.5	10.0
ডোমেইন-নির্দিষ্ট	3.0	10.0
Sadharon Buddhimotta	4.1	10.0
নির্দেশনা অনুসরণ	9.8	10.0
ধাঁধা সমাধান	2.9	7.2
টুল কলিং	3.0	10.0

Ling-2.6-flash

Hamster playing table tennis

#84 Ling 2.6 Flash

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল