নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.5-Flash

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-12

মেট্রিক Seed-2.0-Lite Seed-2.0-Lite none প্রকাশ: 2026-02-14 Qwen3.5-Flash Qwen3.5-Flash none প্রকাশ: 2026-02-24
র‍্যাঙ্ক #45 #41
গড় স্কোর 4.9 5.2
ধারাবাহিকতা 7.4 9.6
প্রতি ফলাফলে খরচ 0.214 0.077
মোট খরচ $0.015 $0.006
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 56.3% 45.8%
অস্থির টেস্ট 5 1
মোট রান 48 48
আউটপুট টোকেন 2,743 3,774
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 2.49s 3.54s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 6.70s 13.73s
প্রতিক্রিয়া সময় (মোট) 39.91s 56.70s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

গড় স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 4.6 22.2% 2 2.93s 703 0
Qwen3.5-Flash 2.3 7.8 11.1% 1 1.62s 687 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 0.0% 0 6.59s 498 0
Qwen3.5-Flash 10.0 10.0 0.0% 0 6.22s 1,794 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 9.9 10.0 100.0% 0 1.82s 246 0
Qwen3.5-Flash 9.9 10.0 100.0% 0 1.57s 243 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 7.2 22.2% 1 1.33s 17 0
Qwen3.5-Flash 7.0 10.0 66.7% 0 905ms 15 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 803ms 100 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Qwen3.5-Flash 5.0 10.0 50.0% 0 8.81s 63 0
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 4.0 4.4 55.6% 2 2.46s 620 0
Qwen3.5-Flash 1.3 10.0 0.0% 0 5.90s 608 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 264 0

দ্রুত তুলনা

তুলনার জুটি বদলান