নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs xAI: Grok 4.20

সারাংশ

Seed-2.0-Mini vs Grok 4.20 benchmark তুলনা: Seed-2.0-Mini average score-এ এগিয়ে: 7.4 vs 7.3. Seed-2.0-Mini-এর benchmark খরচ কম: $0.044 vs $0.609. Grok 4.20 দ্রুত: 27.68s vs 80.22s, pass rates 57.1% vs 63.5%.

প্রস্তাবিত মডেল: Seed-2.0-Mini - It has the best score here (7.4), while costing about 14.0x less than Grok 4.20.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক Seed-2.0-Mini Seed-2.0-Mini medium প্রকাশ: 2026-02-14 Grok 4.20 Grok 4.20 medium প্রকাশ: 2026-03-31
স্কোর 7.4 7.3
র‍্যাঙ্ক #50 #53
নির্ভরযোগ্যতা 6.7 10.0
ধারাবাহিকতা 9.3 8.8
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 57.1% 63.5%
অস্থির টেস্ট 2 3
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.397 8.309
মোট খরচ $0.044 $0.609
ইনপুট মূল্য $0.100 / 1M $1.250 / 1M
আউটপুট মূল্য $0.400 / 1M $2.500 / 1M
মোট ইনপুট টোকেন 41,904 44,433
আউটপুট টোকেন 2,555 1,819
রিজনিং টোকেন 95,974 219,524
প্রতিক্রিয়া সময় (গড়) 80.22s 27.68s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 262.83s 199.66s
প্রতিক্রিয়া সময় (মোট) 1363.72s 581.26s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#50 Seed-2.0-Mini

medium
খরচ
$0.002
সময়
161.7s
টোকেন
4,379 tok

#53 xAI: Grok 4.20

medium
খরচ
$0.041
সময়
110.3s
টোকেন
16,336 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 791 360 9,520
Grok 4.20 8.2 7.9 83.3% 1 3.95s 2,010 287 8,312
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 5.5 9.8 33.3% 0 220.48s 3,823 464 34,964
Grok 4.20 6.3 6.6 55.6% 1 109.93s 8,307 268 103,150
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 16,533 404 29,806
Grok 4.20 10.0 10.0 100.0% 0 17.40s 12,909 232 9,556
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 8,568 246 2,743
Grok 4.20 10.0 10.0 100.0% 0 4.17s 7,761 180 5,333
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0 0
Grok 4.20 5.3 10.0 33.3% 0 27.03s 1,764 375 49,339
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 585 213 4,210
Grok 4.20 3.9 2.6 33.3% 1 24.48s 825 65 6,440
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 840 69 2,050
Grok 4.20 9.8 10.0 100.0% 0 4.26s 1,362 57 6,419
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 8.2 7.2 88.9% 1 31.79s 903 527 5,667
Grok 4.20 7.7 10.0 66.7% 0 6.22s 1,689 149 7,913
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 9,585 222 5,235
Grok 4.20 3.0 10.0 0.0% 0 13.68s 7,275 197 6,620
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 276 50 1,779
Grok 4.20 3.0 10.0 0.0% 0 63.48s 531 9 16,442

দ্রুত তুলনা

তুলনার জুটি বদলান