#68

Qwen3.5-35B-A3B

Qwen প্রকাশ: 2026-02-24 পরীক্ষিত হয়েছে: 2026-04-11 01:19 qwen/qwen3.5-35b-a3b::none

(medium) (none)

সারাংশ

Qwen3.5-35B-A3B AI BENCHY-তে 6.1 স্কোর করে এবং #68 স্থানে আছে। এর reliability প্রযোজ্য নয়, pass rate 50.0%, মোট খরচ $0.016, এবং গড় response time 3.82s.

Qwen3.5-35B-A3B কে আলাদা করে যা: এটি কোডিং-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #1; আর ধাঁধা সমাধান এর দুর্বলতম ক্ষেত্র, rank #14. এই score range-এর জন্য মোট benchmark খরচ অস্বাভাবিকভাবে কম।

স্কোর

6.1

ধারাবাহিকতা

8.7

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট খরচ (বর্তমান মূল্য)

$0.016

মোট আউটপুট টোকেন

4,300

মোট ইনপুট টোকেন

ইনপুট মূল্য

$0.163 / 1M

আউটপুট মূল্য

$1.300 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 11

প্রতি চেষ্টায় পাস রেট: 50.0%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

3.82s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 47.43s

প্রতিক্রিয়া সময় (মোট): 68.74s

ভুল উত্তর: 9 নির্দেশনা অনুসরণ করা হয়নি: 2

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#68 Qwen3.5-35B-A3B

none

খরচ: $0.005
সময়: 28.4s
টোকেন: 4,518 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-06-04 13:29 নতুন টেস্ট যোগ হয়েছে	5.6	10.0	$0.012 ↓	তুলনা করুন
2026-05-22 00:00 স্যুইট পরিবর্তিত হয়েছে	5.8	10.0	$0.016	তুলনা করুন
2026-04-11 01:19 প্রথম নথিভুক্ত রান	6.1	প্রযোজ্য নয়	$0.016	বর্তমান রান

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-04-11 01:19 · প্রথম নথিভুক্ত রান	6.1	8.7	প্রযোজ্য নয়	7/18	3	4,300	$0.016	3.82s
2026-05-22 00:00 · স্যুইট পরিবর্তিত হয়েছে	5.8	8.9	10.0	7/20	3	4,334	$0.016	3.50s
পার্থক্য	+0.3	-0.2		0	0	-34	-$0.001	+319ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

Qwen3.5-35B-A3BnonevsGPT-5.6 Lunalow Qwen3.5-35B-A3BnonevsGPT-5.5none Qwen3.5-35B-A3BnonevsGemini 2.5 Flashnone Qwen3.5-35B-A3BnonevsQwen3.5-35B-A3Bmedium Qwen3.5-35B-A3BnonevsGemini 3.1 Flash Liteminimal Qwen3.5-35B-A3BnonevsGemini 3.5 Flashhigh Qwen3.5-35B-A3BnonevsGemini 3 Flash Previewmedium Qwen3.5-35B-A3BnonevsNemotron 3 Ultra 550b A55bmediumবিনামূল্যে উপলভ্য Qwen3.5-35B-A3BnonevsGPT-5.5low

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	3.4	7.9
কোডিং	10.0	10.0
সমন্বিত	3.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	7.7	10.0
Sadharon Buddhimotta	6.5	3.4
নির্দেশনা অনুসরণ	6.3	10.0
ধাঁধা সমাধান	3.9	7.4
টুল কলিং	10.0	10.0

Qwen3.5-35B-A3B

Hamster playing table tennis

#68 Qwen3.5-35B-A3B

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল