নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs Qwen: Qwen3.6 Flash

সারাংশ

Seed-2.0-Mini vs Qwen3.6 Flash benchmark তুলনা: average score প্রায় সমান: 7.4 vs 7.5. Seed-2.0-Mini-এর benchmark খরচ কম: $0.044 vs $0.288. Qwen3.6 Flash দ্রুত: 19.25s vs 80.22s, pass rates 57.1% vs 71.4%.

প্রস্তাবিত মডেল: Seed-2.0-Mini - It has the best score here (7.4), while costing about 6.6x less than Qwen3.6 Flash.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক Seed-2.0-Mini Seed-2.0-Mini medium প্রকাশ: 2026-02-14 Qwen3.6 Flash Qwen3.6 Flash medium প্রকাশ: 2026-04-20
স্কোর 7.4 7.5
র‍্যাঙ্ক #51 #49
নির্ভরযোগ্যতা 6.7 10.0
ধারাবাহিকতা 9.3 8.1
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 57.1% 71.4%
অস্থির টেস্ট 2 5
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.397 3.030
মোট খরচ $0.044 $0.288
ইনপুট মূল্য $0.100 / 1M $0.188 / 1M
আউটপুট মূল্য $0.400 / 1M $1.125 / 1M
মোট ইনপুট টোকেন 41,904 42,362
আউটপুট টোকেন 2,555 2,995
রিজনিং টোকেন 95,974 245,358
প্রতিক্রিয়া সময় (গড়) 80.22s 19.25s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 262.83s 122.87s
প্রতিক্রিয়া সময় (মোট) 1363.72s 404.20s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#51 Seed-2.0-Mini

medium
Cost
$0.002
Time
161.7s
Tokens
4,379 tok

#49 Qwen3.6 Flash

medium
Invalid SVG
Cost
$0.008
Time
29.9s
Tokens
6,784 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 791 360 9,520
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.10s 672 624 14,024
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 5.5 9.8 33.3% 0 220.48s 3,823 464 34,964
Qwen3.6 Flash 5.0 5.1 44.5% 2 42.85s 7,895 495 67,967
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 16,533 404 29,806
Qwen3.6 Flash 10.0 10.0 100.0% 0 20.28s 14,934 483 13,839
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 8,568 246 2,743
Qwen3.6 Flash 10.0 10.0 100.0% 0 9.65s 7,782 270 13,155
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0 0
Qwen3.6 Flash 3.5 4.4 33.3% 2 14.65s 771 60 24,409
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 585 213 4,210
Qwen3.6 Flash 4.8 9.9 0.0% 0 9.88s 516 140 5,445
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 840 69 2,050
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.05s 699 102 7,423
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 8.2 7.2 88.9% 1 31.79s 903 527 5,667
Qwen3.6 Flash 8.2 7.2 88.9% 1 6.29s 696 460 10,860
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 9,585 222 5,235
Qwen3.6 Flash 10.0 10.0 100.0% 0 4.00s 8,193 335 1,188
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 276 50 1,779
Qwen3.6 Flash 3.0 10.0 0.0% 0 122.87s 204 26 87,048

দ্রুত তুলনা

তুলনার জুটি বদলান