নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Poolside: Laguna XS 2.1 vs Qwen: Qwen3.5-35B-A3B

সারাংশ

Laguna XS 2.1 vs Qwen3.5-35B-A3B benchmark তুলনা: Qwen3.5-35B-A3B average score-এ এগিয়ে: 6.3 vs 5.3. Laguna XS 2.1-এর benchmark খরচ কম: $0.003 vs $0.401. Laguna XS 2.1 দ্রুত: 722ms vs 72.57s, pass rates 31.8% vs 69.8%.

প্রস্তাবিত মডেল: Laguna XS 2.1 - It offers the best overall trade-off: a competitive score (5.3), lower cost than Qwen3.5-35B-A3B, and balanced response time.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-07-02

মেট্রিক Laguna XS 2.1 Laguna XS 2.1 none প্রকাশ: 2026-07-02 বিনামূল্যে উপলভ্য Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium প্রকাশ: 2026-02-24
স্কোর 5.3 6.3
র‍্যাঙ্ক #128 #92
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.0 7.5
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 31.8% 69.8%
অস্থির টেস্ট 3 6
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.058 5.162
মোট খরচ $0.003 $0.401
ইনপুট মূল্য $0.060 / 1M $0.140 / 1M
আউটপুট মূল্য $0.120 / 1M $1.000 / 1M
মোট ইনপুট টোকেন 41,148 42,196
আউটপুট টোকেন 3,451 40,630
রিজনিং টোকেন 0 353,577
প্রতিক্রিয়া সময় (গড়) 722ms 72.57s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 2.30s 409.98s
প্রতিক্রিয়া সময় (মোট) 15.17s 1524.04s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#128 Laguna XS 2.1

none
খরচ
$0.001
সময়
27.6s
টোকেন
4,344 tok

#92 Qwen3.5-35B-A3B

medium
খরচ
$0.009
সময়
71.4s
টোকেন
8,631 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Laguna XS 2.1 5.3 8.3 33.3% 1 755ms 774 1,015 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.13s 672 798 42,652
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Laguna XS 2.1 4.3 7.8 22.2% 1 623ms 7,995 562 0
Qwen3.5-35B-A3B 5.9 9.3 33.3% 0 206.65s 4,106 23,844 111,462
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Laguna XS 2.1 3.0 10.0 0.0% 0 1.76s 14,197 402 0
Qwen3.5-35B-A3B 4.7 1.6 66.7% 1 75.34s 20,992 775 12,485
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Laguna XS 2.1 10.0 10.0 100.0% 0 768ms 7,734 240 0
Qwen3.5-35B-A3B 7.3 5.9 83.3% 1 59.33s 6,061 235 19,493
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Laguna XS 2.1 5.3 10.0 33.3% 0 364ms 834 14 0
Qwen3.5-35B-A3B 4.1 4.4 44.5% 2 88.34s 500 41 46,368
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Laguna XS 2.1 5.0 10.0 0.0% 0 529ms 537 128 0
Qwen3.5-35B-A3B 2.8 1.6 33.3% 1 30.30s 172 20 3,753
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Laguna XS 2.1 3.8 5.8 33.3% 1 364ms 638 50 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 699 97 17,361
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Laguna XS 2.1 3.0 10.0 0.0% 0 1.01s 771 730 0
Qwen3.5-35B-A3B 8.2 7.2 88.9% 1 33.13s 597 3,592 26,585
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Laguna XS 2.1 10.0 10.0 100.0% 0 1.36s 7,413 300 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 8,193 309 1,365
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Laguna XS 2.1 3.0 10.0 0.0% 0 254ms 255 10 0
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 177.35s 204 10,919 72,053

দ্রুত তুলনা

তুলনার জুটি বদলান