#109

Qwen3.6 27B

Qwen প্রকাশ: 2026-04-20 পরীক্ষিত হয়েছে: 2026-07-16 22:13 qwen/qwen3.6-27b::medium

(medium) (none)

সারাংশ

Qwen3.6 27B AI BENCHY-তে 6.5 স্কোর করে এবং #109 স্থানে আছে। এর reliability 10.0, pass rate 59.1%, মোট খরচ $0.680, এবং গড় response time 106.32s.

Qwen3.6 27B কে আলাদা করে যা: এটি কোডিং-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #1; আর ডেটা পার্সিং ও নিষ্কাশন এর দুর্বলতম ক্ষেত্র, rank #13.

স্কোর

6.5

ধারাবাহিকতা

8.0

নির্ভরযোগ্যতা

10.0

মোট খরচ (বর্তমান মূল্য)

$0.680 ↓ -7.1%

পরীক্ষার সময়: $0.732

মোট আউটপুট টোকেন

274,192

মোট ইনপুট টোকেন

106,167

ইনপুট মূল্য

$0.290 / 1M

আউটপুট মূল্য

$2.400 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 12

প্রতি চেষ্টায় পাস রেট: 59.1%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

106.32s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 1085.11s

প্রতিক্রিয়া সময় (মোট): 2339.12s

ভুল উত্তর: 6 কোন উত্তর নেই: 3 অবৈধ টুল কল: 2 নির্দেশনা অনুসরণ করা হয়নি: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#109 Qwen3.6 27B

medium

খরচ: $0.009
সময়: 39.6s
টোকেন: 3,090 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-07-16 22:13 নতুন টেস্ট যোগ হয়েছে	6.5	10.0	$0.779 ↑	বর্তমান রান
2026-06-04 13:21 নতুন টেস্ট যোগ হয়েছে	6.8	10.0	$0.444 ↑	তুলনা করুন
2026-05-21 23:59 স্যুইট পরিবর্তিত হয়েছে	6.6	9.9	$0.272	তুলনা করুন
2026-04-27 21:48 নতুন টেস্ট যোগ হয়েছে	7.0	10.0	$0.209	তুলনা করুন
2026-04-27 21:31 প্রথম নথিভুক্ত রান	7.9	10.0	$0.043	তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট ইনপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-07-16 22:13 · বর্তমান রান	6.5	8.0	10.0	10/22	6	274,192	106,167	$0.680	106.32s
2026-04-27 21:31 · প্রথম নথিভুক্ত রান	7.9	8.5	10.0	4/6	1	21,553	0	$0.043	25.56s
পার্থক্য	-1.3	-0.5	0.0	+6	+5	+252639	+106167	+$0.638	+80768ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ	ইনপুট মূল্য	আউটপুট মূল্য
2026-06-04 15:40	$0.290 / 1M	$3.200 / 1M
2026-06-10 13:42	$0.290 / 1M	$2.400 / 1M
2026-06-12 18:42	$0.288 / 1M	$3.100 / 1M
2026-06-17 10:07	$0.289 / 1M	$3.170 / 1M
2026-06-29 01:00	$0.260 / 1M	$2.386 / 1M
2026-06-30 21:25	$0.286 / 1M	$2.400 / 1M
2026-07-16 15:36	$0.450 / 1M	$2.700 / 1M
2026-07-24 00:05	$0.600 / 1M	$3.600 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

Qwen3.6 27BmediumvsGemini 3.5 Flash-Litemedium Qwen3.6 27BmediumvsMiMo-V2.5medium Qwen3.6 27BmediumvsQwen3.6 Max Previewnone Qwen3.6 27BmediumvsLaguna XS 2.1mediumবিনামূল্যে উপলভ্য Qwen3.6 27BmediumvsLongCat 2.0high Qwen3.6 27BmediumvsQwen3.5-27Bnone Qwen3.6 27BmediumvsGLM 5.2none Qwen3.6 27BmediumvsGemini 3.1 Flash Lite Previewlow Qwen3.6 27BmediumvsGemma 4 26B A4Bmediumবিনামূল্যে উপলভ্য Qwen3.6 27BmediumvsGemini 3.1 Flash Litelow

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	8.3	10.0
কোডিং	7.7	10.0
সমন্বিত	6.7	3.7
ডেটা পার্সিং ও নিষ্কাশন	3.5	1.4
ডোমেইন-নির্দিষ্ট	2.9	7.2
Sadharon Buddhimotta	6.5	3.4
নির্দেশনা অনুসরণ	10.0	10.0
ধাঁধা সমাধান	7.7	10.0
টুল কলিং	10.0	10.0
সাধারণ জ্ঞান	3.0	10.0

Qwen3.6 27B

Hamster playing table tennis

#109 Qwen3.6 27B

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল