নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs DeepSeek: DeepSeek V4 Flash

সারাংশ

Seed-2.0-Lite vs DeepSeek V4 Flash benchmark তুলনা: Seed-2.0-Lite average score-এ এগিয়ে: 8.2 vs 7.7. DeepSeek V4 Flash-এর benchmark খরচ কম: $0.029 vs $0.175. DeepSeek V4 Flash দ্রুত: 45.85s vs 47.07s, pass rates 76.2% vs 74.6%.

প্রস্তাবিত মডেল: DeepSeek V4 Flash - Its score stays close to the best score here (7.7 vs 8.2), while costing about 6.1x less than Seed-2.0-Lite.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-10

মেট্রিক Seed-2.0-Lite Seed-2.0-Lite medium প্রকাশ: 2026-02-14 DeepSeek V4 Flash DeepSeek V4 Flash high প্রকাশ: 2026-04-24
স্কোর 8.2 7.7
র‍্যাঙ্ক #20 #32
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.0 8.5
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 76.2% 74.6%
অস্থির টেস্ট 3 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 1.250 0.299
মোট খরচ $0.175 $0.029
ইনপুট মূল্য $0.250 / 1M $0.099 / 1M
আউটপুট মূল্য $2.000 / 1M $0.197 / 1M
মোট ইনপুট টোকেন 46,740 39,745
আউটপুট টোকেন 3,230 10,310
রিজনিং টোকেন 78,406 123,501
প্রতিক্রিয়া সময় (গড়) 47.07s 45.85s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 254.92s 218.13s
প্রতিক্রিয়া সময় (মোট) 988.37s 962.79s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#20 Seed-2.0-Lite

medium
Cost
$0.005
Time
86.7s
Tokens
2,354 tok

#32 DeepSeek V4 Flash

high
Cost
$0.003
Time
93.1s
Tokens
7,926 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 942 996 7,142
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 540 140 7,770
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 8.0 9.8 66.7% 0 156.74s 8,247 458 31,890
DeepSeek V4 Flash 7.8 10.0 66.7% 0 50.60s 7,279 395 34,862
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 16,254 506 4,299
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 14,016 465 7,347
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 8,562 246 1,742
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 7,290 201 1,179
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 843 15 23,897
DeepSeek V4 Flash 4.1 4.4 44.5% 2 100.31s 666 27 59,249
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 582 304 1,620
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 471 79 632
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 834 71 1,480
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 627 63 1,622
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 9.0 7.9 88.9% 1 10.23s 894 403 3,285
DeepSeek V4 Flash 8.2 7.2 88.9% 1 26.11s 594 196 1,767
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 9,306 222 1,011
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 8,079 228 542
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 3.0 10.0 0.0% 0 48.32s 276 9 2,040
DeepSeek V4 Flash 3.0 10.0 0.0% 0 54.46s 183 8,516 8,531

দ্রুত তুলনা

তুলনার জুটি বদলান