নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.5 Plus 2026-02-15

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-12

মেট্রিক Seed-2.0-Lite Seed-2.0-Lite medium প্রকাশ: 2026-02-14 Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium প্রকাশ: 2026-02-15
র‍্যাঙ্ক #3 #5
গড় স্কোর 8.5 8.3
ধারাবাহিকতা 8.7 9.5
প্রতি ফলাফলে খরচ 0.870 1.264
মোট খরচ $0.105 $0.165
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 87.5% 85.4%
অস্থির টেস্ট 3 1
মোট রান 48 48
আউটপুট টোকেন 2,815 1,735
রিজনিং টোকেন 44,618 77,212
প্রতিক্রিয়া সময় (গড়) 29.39s 34.45s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 168.71s 79.86s
প্রতিক্রিয়া সময় (মোট) 470.29s 310.09s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

গড় স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 23.34s 990 7,037
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 10.37s 186 5,926
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.85s 421 7,906
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 9.9 10.0 100.0% 0 9.07s 246 1,742
Qwen3.5 Plus 2026-02-15 9.9 10.0 100.0% 0 46.91s 270 14,916
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 4.0 7.2 55.6% 1 88.74s 15 23,897
Qwen3.5 Plus 2026-02-15 4.0 10.0 33.3% 0 17.50s 35 16,680
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 7.0 3.6 66.7% 1 18.25s 304 1,620
Qwen3.5 Plus 2026-02-15 10.0 1.6 66.7% 1 79.86s 73 8,675
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 31.93s 101 7,704
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 9.3 7.9 88.9% 1 11.03s 461 3,532
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 34.57s 340 14,496
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 7.54s 309 909

দ্রুত তুলনা

তুলনার জুটি বদলান