নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Google: Gemini 3.1 Pro Preview

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-04-26

মেট্রিক Seed-2.0-Lite Seed-2.0-Lite none প্রকাশ: 2026-02-14 Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium প্রকাশ: 2026-02-19
স্কোর 6.2 9.6
র‍্যাঙ্ক #72 #2
নির্ভরযোগ্যতা প্রযোজ্য নয় প্রযোজ্য নয়
ধারাবাহিকতা 7.7 10.0
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 55.6% 94.4%
অস্থির টেস্ট 5 0
মোট রান 54 54
প্রতি ফলাফলে খরচ 0.200 3.400
মোট খরচ $0.016 $0.578
???? ??? $0.250 / 1M $2.000 / 1M
????? ??? $2.000 / 1M $12.000 / 1M
আউটপুট টোকেন 3,129 1,932
রিজনিং টোকেন 0 40,542
প্রতিক্রিয়া সময় (গড়) 2.53s 15.96s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 6.70s 40.61s
প্রতিক্রিয়া সময় (মোট) 45.46s 175.52s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 709 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 4.61s 380 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 498 0
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 246 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 17 0
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 5.2 4.4 55.6% 2 2.46s 620 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982

দ্রুত তুলনা

তুলনার জুটি বদলান