#11

Qwen3.5-27B

Qwen প্রকাশ: 2026-02-24 পরীক্ষিত হয়েছে: 2026-04-11 01:44 qwen/qwen3.5-27b::medium

(medium) (none)

সারাংশ

Qwen3.5-27B AI BENCHY-তে 8.4 স্কোর করে এবং #11 স্থানে আছে। এর reliability প্রযোজ্য নয়, pass rate 81.5%, মোট খরচ $0.497, এবং গড় response time 53.03s.

Qwen3.5-27B কে আলাদা করে যা: এটি অস্বাভাবিকভাবে বেশি reasoning tokens ব্যবহার করে, যা ধীর বা বেশি খরচের runs ব্যাখ্যা করতে পারে।

স্কোর

8.4

ধারাবাহিকতা

8.8

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট খরচ (বর্তমান মূল্য)

$0.497

মোট আউটপুট টোকেন

245,000

মোট ইনপুট টোকেন

ইনপুট মূল্য

$0.195 / 1M

আউটপুট মূল্য

$1.560 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 5

প্রতি চেষ্টায় পাস রেট: 81.5%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

53.03s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 163.96s

প্রতিক্রিয়া সময় (মোট): 954.46s

নির্দেশনা অনুসরণ করা হয়নি: 2 অতিরিক্ত ফরম্যাটিং: 1 টাইমআউট: 1 ভুল উত্তর: 1

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#11 Qwen3.5-27B

medium

খরচ: $0.008
সময়: 62.0s
টোকেন: 3,099 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-06-04 13:40 নতুন টেস্ট যোগ হয়েছে	7.8	10.0	$0.536 ↓	তুলনা করুন
2026-05-22 00:04 স্যুইট পরিবর্তিত হয়েছে	7.9	10.0	$0.607	তুলনা করুন
2026-04-11 01:44 প্রথম নথিভুক্ত রান	8.4	প্রযোজ্য নয়	$0.497	বর্তমান রান

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-04-11 01:44 · প্রথম নথিভুক্ত রান	8.4	8.8	প্রযোজ্য নয়	13/18	3	245,000	$0.497	53.03s
2026-05-22 00:04 · স্যুইট পরিবর্তিত হয়েছে	7.9	8.9	10.0	13/20	3	314,583	$0.607	60.85s
পার্থক্য	+0.5	-0.1		0	0	-69583	-$0.110	-7821ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

Qwen3.5-27BmediumvsGPT-5.4 Minimedium Qwen3.5-27BmediumvsGLM 5.2high Qwen3.5-27BmediumvsClaude Sonnet 5medium Qwen3.5-27BmediumvsNemotron 3 Ultra 550b A55bmediumবিনামূল্যে উপলভ্য Qwen3.5-27BmediumvsQwen3.6 Plusmedium Qwen3.5-27BmediumvsGemini 3.5 Flashhigh Qwen3.5-27BmediumvsGemini 3 Flash Previewmedium Qwen3.5-27BmediumvsGPT-5.5low

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	8.7	7.9
কোডিং	10.0	10.0
সমন্বিত	10.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	5.3	10.0
Sadharon Buddhimotta	6.1	3.1
নির্দেশনা অনুসরণ	10.0	10.0
ধাঁধা সমাধান	8.2	7.7
টুল কলিং	10.0	10.0

Qwen3.5-27B

Hamster playing table tennis

#11 Qwen3.5-27B

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল