নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.5-9B

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-12

মেট্রিক Seed-2.0-Lite Seed-2.0-Lite none প্রকাশ: 2026-02-14 Qwen3.5-9B Qwen3.5-9B medium প্রকাশ: 2026-03-02
র‍্যাঙ্ক #45 #66
গড় স্কোর 4.9 2.6
ধারাবাহিকতা 7.4 7.4
প্রতি ফলাফলে খরচ 0.214 0.779
মোট খরচ $0.015 $0.024
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 56.3% 35.4%
অস্থির টেস্ট 5 5
মোট রান 48 48
আউটপুট টোকেন 2,743 17,930
রিজনিং টোকেন 0 139,706
প্রতিক্রিয়া সময় (গড়) 2.49s 71.44s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 6.70s 226.38s
প্রতিক্রিয়া সময় (মোট) 39.91s 928.77s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

গড় স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 4.6 22.2% 2 2.93s 703 0
Qwen3.5-9B 4.0 7.2 55.6% 1 31.54s 2,410 10,913
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 0.0% 0 6.59s 498 0
Qwen3.5-9B 10.0 10.0 0.0% 0 0ms 0 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 9.9 10.0 100.0% 0 1.82s 246 0
Qwen3.5-9B 5.0 5.6 33.3% 1 87.31s 1,383 32,113
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 7.2 22.2% 1 1.33s 17 0
Qwen3.5-9B 10.0 7.2 22.2% 1 137.75s 11,549 48,475
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Qwen3.5-9B 10.0 1.6 33.3% 1 226.38s 0 30,695
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Qwen3.5-9B 5.5 5.8 66.7% 1 17.15s 599 4,517
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 4.0 4.4 55.6% 2 2.46s 620 0
Qwen3.5-9B 10.0 10.0 0.0% 0 33.38s 1,545 11,844
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 444 1,149

দ্রুত তুলনা

তুলনার জুটি বদলান