নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Google: Gemini 3.1 Pro Preview

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-12

মেট্রিক Seed-2.0-Lite Seed-2.0-Lite none প্রকাশ: 2026-02-14 Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium প্রকাশ: 2026-02-19
র‍্যাঙ্ক #45 #2
গড় স্কোর 4.9 9.4
ধারাবাহিকতা 7.4 10.0
প্রতি ফলাফলে খরচ 0.214 3.417
মোট খরচ $0.015 $0.513
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 56.3% 93.8%
অস্থির টেস্ট 5 0
মোট রান 48 48
আউটপুট টোকেন 2,743 1,521
রিজনিং টোকেন 0 35,656
প্রতিক্রিয়া সময় (গড়) 2.49s 16.60s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 6.70s 40.61s
প্রতিক্রিয়া সময় (মোট) 39.91s 149.36s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

গড় স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 4.6 22.2% 2 2.93s 703 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.52s 106 2,533
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 0.0% 0 6.59s 498 0
Gemini 3.1 Pro Preview 9.0 10.0 100.0% 0 40.61s 432 9,281
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 9.9 10.0 100.0% 0 1.82s 246 0
Gemini 3.1 Pro Preview 9.9 10.0 100.0% 0 7.72s 279 3,904
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 7.2 22.2% 1 1.33s 17 0
Gemini 3.1 Pro Preview 7.0 10.0 66.7% 0 32.73s 18 12,424
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 4.0 4.4 55.6% 2 2.46s 620 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982

দ্রুত তুলনা

তুলনার জুটি বদলান