#32

Qwen3.6 35B A3B

Qwen প্রকাশ: 2026-04-20 পরীক্ষিত হয়েছে: 2026-05-22 00:02 qwen/qwen3.6-35b-a3b::medium

(medium) (none)

সারাংশ

Qwen3.6 35B A3B AI BENCHY-তে 7.8 স্কোর করে এবং #32 স্থানে আছে। এর reliability 9.4, pass rate 70.4%, মোট খরচ $0.126, এবং গড় response time 17.26s.

Qwen3.6 35B A3B কে আলাদা করে যা: এই score range-এর জন্য মোট benchmark খরচ অস্বাভাবিকভাবে কম।

স্কোর

7.8

ধারাবাহিকতা

9.1

নির্ভরযোগ্যতা

9.4

মোট খরচ (বর্তমান মূল্য)

$0.126

মোট আউটপুট টোকেন

134,075

মোট ইনপুট টোকেন

ইনপুট মূল্য

$0.150 / 1M

আউটপুট মূল্য

$1.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 6

প্রতি চেষ্টায় পাস রেট: 70.4%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

17.26s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 86.11s

প্রতিক্রিয়া সময় (মোট): 310.77s

ভুল উত্তর: 4 নির্দেশনা অনুসরণ করা হয়নি: 1 কোন উত্তর নেই: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#32 Qwen3.6 35B A3B

medium

অবৈধ SVG

খরচ: $0.000
সময়: 300.0s
টোকেন: 0 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-07-16 22:06 নতুন টেস্ট যোগ হয়েছে	6.7	10.0	$0.746 ↑	তুলনা করুন
2026-06-04 13:20 নতুন টেস্ট যোগ হয়েছে	7.4	10.0	$0.146 ↑	তুলনা করুন
2026-05-22 00:02 স্যুইট পরিবর্তিত হয়েছে	7.8	9.4	$0.126	বর্তমান রান
2026-04-27 23:06 প্রথম রান	8.8	10.0	$0.104	তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-05-22 00:02 · স্যুইট পরিবর্তিত হয়েছে	7.8	9.1	9.4	12/18	2	134,075	$0.126	17.26s
2026-04-27 23:06 · প্রথম রান	8.8	9.5	10.0	13/16	1	112,261	$0.104	11.98s
পার্থক্য	-1.0	-0.4	-0.6	-1	+1	+21814	+$0.023	+5280ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

Qwen3.6 35B A3BmediumvsGemini 3 Flash Previewnone Qwen3.6 35B A3BmediumvsGemini 3.5 Flash-Litelow Qwen3.6 35B A3BmediumvsGemini 3.5 Flashminimal Qwen3.6 35B A3BmediumvsLongCat 2.0low Qwen3.6 35B A3BmediumvsGPT-5.5none Qwen3.6 35B A3BmediumvsKAT-Coder-Pro V2.5none Qwen3.6 35B A3BmediumvsStep 3.7 Flashhigh Qwen3.6 35B A3BmediumvsGemma 4 26B A4Bmediumবিনামূল্যে উপলভ্য Qwen3.6 35B A3BmediumvsQwen3.6 Flashmedium Qwen3.6 35B A3BmediumvsGLM 5.2none

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	10.0	10.0
কোডিং	6.6	10.0
সমন্বিত	0.0	0.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	5.3	7.2
Sadharon Buddhimotta	4.4	9.9
নির্দেশনা অনুসরণ	10.0	10.0
ধাঁধা সমাধান	7.9	7.5
টুল কলিং	0.0	0.0
সাধারণ জ্ঞান	3.0	10.0

Qwen3.6 35B A3B

Hamster playing table tennis

#32 Qwen3.6 35B A3B

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল