নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs StepFun: Step 3.7 Flash

সারাংশ

Seed-2.0-Lite vs Step 3.7 Flash benchmark তুলনা: Seed-2.0-Lite average score-এ এগিয়ে: 8.2 vs 7.3. Seed-2.0-Lite-এর benchmark খরচ কম: $0.175 vs $0.341. Step 3.7 Flash দ্রুত: 15.74s vs 47.07s, pass rates 76.2% vs 68.3%.

প্রস্তাবিত মডেল: Seed-2.0-Lite - It has the best score here (8.2), while costing about 1.9x less than Step 3.7 Flash.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-10

মেট্রিক Seed-2.0-Lite Seed-2.0-Lite medium প্রকাশ: 2026-02-14 Step 3.7 Flash Step 3.7 Flash low প্রকাশ: 2026-05-29
স্কোর 8.2 7.3
র‍্যাঙ্ক #20 #58
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.0 8.4
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 76.2% 68.3%
অস্থির টেস্ট 3 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 1.250 2.840
মোট খরচ $0.175 $0.341
ইনপুট মূল্য $0.250 / 1M $0.200 / 1M
আউটপুট মূল্য $2.000 / 1M $1.150 / 1M
মোট ইনপুট টোকেন 46,740 40,101
আউটপুট টোকেন 3,230 289,325
রিজনিং টোকেন 78,406 0
প্রতিক্রিয়া সময় (গড়) 47.07s 15.74s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 254.92s 124.75s
প্রতিক্রিয়া সময় (মোট) 988.37s 330.63s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#20 Seed-2.0-Lite

medium
Cost
$0.005
Time
86.7s
Tokens
2,354 tok

#58 Step 3.7 Flash

low
Invalid SVG
Cost
$0.004
Time
25.3s
Tokens
3,072 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 942 996 7,142
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 756 10,896 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 8.0 9.8 66.7% 0 156.74s 8,247 458 31,890
Step 3.7 Flash 8.2 7.2 88.9% 1 9.46s 7,437 18,685 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 16,254 506 4,299
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 13,683 6,426 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 8,562 246 1,742
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 7,398 2,667 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 843 15 23,897
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 828 104,487 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 582 304 1,620
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 525 4,604 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 834 71 1,480
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 735 1,857 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 9.0 7.9 88.9% 1 10.23s 894 403 3,285
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 756 3,564 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 9,306 222 1,011
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 7,746 1,360 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 3.0 10.0 0.0% 0 48.32s 276 9 2,040
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 237 134,779 0

দ্রুত তুলনা

তুলনার জুটি বদলান