Qwen3.6 35B A3B

Qwen প্রকাশ: 2026-04-20 পরীক্ষিত হয়েছে: 2026-04-27 23:06 qwen/qwen3.6-35b-a3b::medium

(medium) (none)

সারাংশ

Qwen3.6 35B A3B AI BENCHY-তে 8.8 স্কোর করে এবং #9 স্থানে আছে। এর reliability 10.0, pass rate 83.3%, মোট খরচ $0.104, এবং গড় response time 11.98s.

Qwen3.6 35B A3B কে আলাদা করে যা: এই score range-এর জন্য মোট benchmark খরচ অস্বাভাবিকভাবে কম।

স্কোর

8.8

ধারাবাহিকতা

9.5

নির্ভরযোগ্যতা

10.0

মোট খরচ (বর্তমান মূল্য)

$0.104

মোট আউটপুট টোকেন

112,261

মোট ইনপুট টোকেন

ইনপুট মূল্য

$0.162 / 1M

আউটপুট মূল্য

$0.966 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 3

প্রতি চেষ্টায় পাস রেট: 83.3%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

11.98s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 45.02s

প্রতিক্রিয়া সময় (মোট): 191.76s

ভুল উত্তর: 2 নির্দেশনা অনুসরণ করা হয়নি: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#9 Qwen3.6 35B A3B

medium

অবৈধ SVG

খরচ: $0.000
সময়: 300.0s
টোকেন: 0 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-07-16 22:06 নতুন টেস্ট যোগ হয়েছে	6.7	10.0	$0.746 ↑	তুলনা করুন
2026-06-04 13:20 নতুন টেস্ট যোগ হয়েছে	7.4	10.0	$0.146 ↑	তুলনা করুন
2026-05-22 00:02 স্যুইট পরিবর্তিত হয়েছে	7.8	9.4	$0.126	তুলনা করুন
2026-04-27 23:06 প্রথম রান	8.8	10.0	$0.104	বর্তমান রান

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট ইনপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-04-27 23:06 · প্রথম রান	8.8	9.5	10.0	13/16	1	112,261	0	$0.104	11.98s
2026-06-04 13:20 · নতুন টেস্ট যোগ হয়েছে	7.4	9.6	10.0	13/21	1	149,851	16,385	$0.146	18.08s
পার্থক্য	+1.3	-0.1	0.0	+2	0	-37590	-16385	-$0.042	-6100ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

Qwen3.6 35B A3BmediumvsGemini 3 Flash Previewnone Qwen3.6 35B A3BmediumvsGemini 3.5 Flash-Litelow Qwen3.6 35B A3BmediumvsGemini 3.5 Flashminimal Qwen3.6 35B A3BmediumvsLongCat 2.0low Qwen3.6 35B A3BmediumvsGPT-5.5none Qwen3.6 35B A3BmediumvsKAT-Coder-Pro V2.5none Qwen3.6 35B A3BmediumvsStep 3.7 Flashhigh Qwen3.6 35B A3BmediumvsGemma 4 26B A4Bmediumবিনামূল্যে উপলভ্য Qwen3.6 35B A3BmediumvsQwen3.6 Flashmedium Qwen3.6 35B A3BmediumvsGLM 5.2none

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	10.0	10.0
কোডিং	10.0	10.0
সমন্বিত	0.0	0.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	5.3	7.2
Sadharon Buddhimotta	4.4	9.9
নির্দেশনা অনুসরণ	10.0	10.0
ধাঁধা সমাধান	10.0	10.0
টুল কলিং	0.0	0.0

Qwen3.6 35B A3B

Hamster playing table tennis

#9 Qwen3.6 35B A3B

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল