AI BENCHY
Your ad here

#3

Seed-2.0-Lite

Bytedance Seed · প্রকাশ: 2026-02-14 · bytedance-seed/seed-2.0-lite::medium

প্রতি ফলাফলে খরচ

0.870

ধারাবাহিকতা

8.7

সঠিক টেস্ট

ভুল টেস্ট: 4

প্রতি চেষ্টায় পাস রেট: 87.5%

অস্থির টেস্ট

3

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

29.39s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 168.71s

প্রতিক্রিয়া সময় (মোট): 470.29s

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

গড় স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ গড় স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 10.0 10.0
সমন্বিত 10.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 9.9 10.0
ডোমেইন-নির্দিষ্ট 4.0 7.2
Sadharon Buddhimotta 7.0 3.6
নির্দেশনা অনুসরণ 10.0 10.0
ধাঁধা সমাধান 9.3 7.9
টুল কলিং 10.0 10.0

তুলনা করা মডেল