নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs xAI: Grok 4.20 Beta

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-12

মেট্রিক Seed-2.0-Mini Seed-2.0-Mini medium প্রকাশ: 2026-02-14 Grok 4.20 Beta Grok 4.20 Beta medium প্রকাশ: 2026-03-12
র‍্যাঙ্ক #25 #24
গড় স্কোর 6.9 7.0
ধারাবাহিকতা 9.1 9.0
প্রতি ফলাফলে খরচ 0.280 5.989
মোট খরচ $0.028 $0.599
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 68.8% 70.8%
অস্থির টেস্ট 2 2
মোট রান 48 48
আউটপুট টোকেন 1,965 1,481
রিজনিং টোকেন 58,456 86,628
প্রতিক্রিয়া সময় (গড়) 65.09s 8.89s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 262.83s 24.21s
প্রতিক্রিয়া সময় (মোট) 846.14s 142.18s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

গড় স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 7.0 10.0 66.7% 0 98.99s 354 9,352
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.19s 262 6,289
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 9.9 10.0 100.0% 0 24.27s 246 2,743
Grok 4.20 Beta 9.9 10.0 100.0% 0 4.01s 180 5,281
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 10.0 10.0 0.0% 0 0ms 0 0
Grok 4.20 Beta 4.0 10.0 33.3% 0 21.33s 251 40,255
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 6.0 3.4 33.3% 1 36.65s 213 4,210
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
Grok 4.20 Beta 9.0 10.0 50.0% 0 4.97s 57 7,107
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 7.0 7.2 88.9% 1 25.85s 457 5,060
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.85s 249 6,660
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
Grok 4.20 Beta 10.0 10.0 0.0% 0 12.39s 183 5,384

দ্রুত তুলনা

তুলনার জুটি বদলান