AI BENCHY
Advertise here
#22

Seed-2.0-Lite

Bytedance Seed প্রকাশ: 2026-02-14 পরীক্ষিত হয়েছে: 2026-05-22 00:37 bytedance-seed/seed-2.0-lite::medium
(medium) (none)

সারাংশ

Seed-2.0-Lite AI BENCHY-তে 8.1 স্কোর করে এবং #22 স্থানে আছে। এর reliability 10.0, pass rate 75.0%, মোট খরচ $0.153, এবং গড় response time 36.79s.

Seed-2.0-Lite কে আলাদা করে যা: এটি ডোমেইন-নির্দিষ্ট-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #4; আর অ্যান্টি-এআই কৌশল এর দুর্বলতম ক্ষেত্র, rank #14.

ধারাবাহিকতা

8.9

মোট আউটপুট টোকেন

70,569

মোট ইনপুট টোকেন

0

ইনপুট মূল্য

$0.250 / 1M

আউটপুট মূল্য

$2.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 7

প্রতি চেষ্টায় পাস রেট: 75.0%

অস্থির টেস্ট

3

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

36.79s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 168.71s

প্রতিক্রিয়া সময় (মোট): 735.86s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#22 Seed-2.0-Lite

medium
Cost
$0.005
Time
86.7s
Tokens
2,354 tok

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-06-04 14:30 নতুন টেস্ট যোগ হয়েছে 8.2 10.0 $0.175 তুলনা করুন
2026-05-22 00:37 পুনরায় পরীক্ষা 8.1 10.0 $0.153 বর্তমান রান
2026-04-11 01:44 প্রথম নথিভুক্ত রান 8.6 প্রযোজ্য নয় $0.121 তুলনা করুন

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট ইনপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-05-22 00:37 · পুনরায় পরীক্ষা8.18.910.013/20370,5690$0.15336.79s
2026-06-04 14:30 · নতুন টেস্ট যোগ হয়েছে8.29.010.014/21381,63646,740$0.17547.07s
পার্থক্য-0.1-0.10.0-10-11067-46740-$0.023-10272ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 8.3 10.0
কোডিং 7.0 9.7
সমন্বিত 10.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 10.0 10.0
ডোমেইন-নির্দিষ্ট 5.9 7.2
Sadharon Buddhimotta 6.7 3.6
নির্দেশনা অনুসরণ 10.0 10.0
ধাঁধা সমাধান 9.0 7.9
টুল কলিং 10.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল