#37

Qwen3.6 27B

Qwen প্রকাশ: 2026-04-20 পরীক্ষিত হয়েছে: 2026-04-27 21:31 qwen/qwen3.6-27b::medium

(medium) (none)

সারাংশ

Qwen3.6 27B AI BENCHY-তে 7.9 স্কোর করে এবং #37 স্থানে আছে। এর reliability 10.0, pass rate 77.8%, মোট খরচ $0.043, এবং গড় response time 25.56s.

স্কোর

7.9

ধারাবাহিকতা

8.5

নির্ভরযোগ্যতা

10.0

মোট খরচ (বর্তমান মূল্য)

$0.043

মোট আউটপুট টোকেন

21,553

মোট ইনপুট টোকেন

ইনপুট মূল্য

$0.500 / 1M

আউটপুট মূল্য

$2.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 2

প্রতি চেষ্টায় পাস রেট: 77.8%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

25.56s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 47.48s

প্রতিক্রিয়া সময় (মোট): 153.33s

কোন উত্তর নেই: 1 ভুল উত্তর: 1

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#37 Qwen3.6 27B

medium

Cost: $0.009
Time: 39.6s
Tokens: 3,090 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-06-04 13:21 নতুন টেস্ট যোগ হয়েছে	6.8	10.0	$0.444 ↑	তুলনা করুন
2026-05-21 23:59 স্যুইট পরিবর্তিত হয়েছে	6.6	9.9	$0.272	তুলনা করুন
2026-04-27 21:48 নতুন টেস্ট যোগ হয়েছে	7.0	10.0	$0.209	তুলনা করুন
2026-04-27 21:31 প্রথম নথিভুক্ত রান	7.9	10.0	$0.043	বর্তমান রান

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-04-27 21:31 · প্রথম নথিভুক্ত রান	7.9	8.5	10.0	4/6	1	21,553	$0.043	25.56s
2026-05-21 23:59 · স্যুইট পরিবর্তিত হয়েছে	6.6	8.1	9.9	9/20	5	118,704	$0.272	57.65s
পার্থক্য	+1.3	+0.4	+0.1	-5	-4	-97151	-$0.229	-32096ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

Qwen3.6 27BmediumvsGPT-5.4 Nanomedium Qwen3.6 27BmediumvsDeepSeek V3.2medium Qwen3.6 27BmediumvsClaude Opus 4.6medium Qwen3.6 27BmediumvsSeed-2.0-Minimedium Qwen3.6 27BmediumvsClaude Opus 4.8none Qwen3.6 27BmediumvsQwen3.6 Max Previewnone Qwen3.6 27BmediumvsGemini 3 Flash Previewmedium Qwen3.6 27BmediumvsGemini 3.5 Flashhigh Qwen3.6 27BmediumvsNemotron 3 Ultra 550b A55bmediumবিনামূল্যে উপলভ্য Qwen3.6 27BmediumvsGemini 3.5 Flashlow

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	10.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	4.3	1.2
ডোমেইন-নির্দিষ্ট	3.0	10.0
নির্দেশনা অনুসরণ	10.0	10.0
টুল কলিং	10.0	10.0

Qwen3.6 27B

Hamster playing table tennis

#37 Qwen3.6 27B

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল