নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.5 Plus 2026-02-15

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-12

মেট্রিক Seed-2.0-Lite Seed-2.0-Lite medium প্রকাশ: 2026-02-14 Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none প্রকাশ: 2026-02-15
র‍্যাঙ্ক #3 #31
গড় স্কোর 8.5 6.2
ধারাবাহিকতা 8.7 9.6
প্রতি ফলাফলে খরচ 0.870 0.172
মোট খরচ $0.105 $0.016
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 87.5% 58.3%
অস্থির টেস্ট 3 1
মোট রান 48 48
আউটপুট টোকেন 2,815 2,015
রিজনিং টোকেন 44,618 0
প্রতিক্রিয়া সময় (গড়) 29.39s 2.65s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 168.71s 6.65s
প্রতিক্রিয়া সময় (মোট) 470.29s 26.52s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

গড় স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 23.34s 990 7,037
Qwen3.5 Plus 2026-02-15 4.0 10.0 33.3% 0 2.74s 514 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
Qwen3.5 Plus 2026-02-15 10.0 10.0 0.0% 0 6.65s 314 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 9.9 10.0 100.0% 0 9.07s 246 1,742
Qwen3.5 Plus 2026-02-15 9.9 10.0 100.0% 0 1.89s 243 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 4.0 7.2 55.6% 1 88.74s 15 23,897
Qwen3.5 Plus 2026-02-15 4.0 10.0 33.3% 0 1.17s 17 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 7.0 3.6 66.7% 1 18.25s 304 1,620
Qwen3.5 Plus 2026-02-15 4.0 3.0 33.3% 1 2.26s 117 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.67s 72 0
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 9.3 7.9 88.9% 1 11.03s 461 3,532
Qwen3.5 Plus 2026-02-15 7.0 10.0 66.7% 0 2.82s 516 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 3.33s 222 0

দ্রুত তুলনা

তুলনার জুটি বদলান