#84

Qwen3.5-Flash

Qwen প্রকাশ: 2026-02-24 পরীক্ষিত হয়েছে: 2026-06-04 13:36 qwen/qwen3.5-flash-02-23::medium

(medium) (none)

সারাংশ

Qwen3.5-Flash AI BENCHY-তে 6.8 স্কোর করে এবং #84 স্থানে আছে। এর reliability 10.0, pass rate 71.4%, মোট খরচ $0.080, এবং গড় response time 63.29s.

Qwen3.5-Flash কে আলাদা করে যা: এটি নির্দেশনা অনুসরণ-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #1; আর কোডিং এর দুর্বলতম ক্ষেত্র, rank #13. এটি অস্বাভাবিকভাবে বেশি reasoning tokens ব্যবহার করে, যা ধীর বা বেশি খরচের runs ব্যাখ্যা করতে পারে।

স্কোর

6.8

ধারাবাহিকতা

8.1

নির্ভরযোগ্যতা

10.0

মোট খরচ (বর্তমান মূল্য)

$0.080 ↓ -23.7%

পরীক্ষার সময়: $0.105

মোট আউটপুট টোকেন

296,686

মোট ইনপুট টোকেন

38,926

ইনপুট মূল্য

$0.065 / 1M

আউটপুট মূল্য

$0.260 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 9

প্রতি চেষ্টায় পাস রেট: 71.4%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

63.29s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 234.29s

প্রতিক্রিয়া সময় (মোট): 1265.85s

ভুল উত্তর: 4 টাইমআউট: 3 API ত্রুটি: 1 নির্দেশনা অনুসরণ করা হয়নি: 1

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#84 Qwen3.5-Flash

medium

খরচ: $0.002
সময়: 25.8s
টোকেন: 4,294 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-06-04 13:36 নতুন টেস্ট যোগ হয়েছে	7.4	8.9	$0.080 ↓	বর্তমান রান
2026-05-21 23:57 স্যুইট পরিবর্তিত হয়েছে	7.4	8.3	$0.104	তুলনা করুন
2026-04-11 01:44 প্রথম নথিভুক্ত রান	7.8	প্রযোজ্য নয়	$0.080	তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট ইনপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-06-04 13:36 · বর্তমান রান	6.8	8.1	10.0	12/21	5	296,686	38,926	$0.080	63.29s
2026-04-11 01:44 · প্রথম নথিভুক্ত রান	7.8	7.3	প্রযোজ্য নয়	11/18	6	193,972	0	$0.080	66.72s
পার্থক্য	-1.0	+0.8		+1	-1	+102714	+38926	+$0.001	-3432ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ	ইনপুট মূল্য	আউটপুট মূল্য
2026-06-04 15:40	$0.065 / 1M	$0.260 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

Qwen3.5-FlashmediumvsGLM 5.1medium Qwen3.5-FlashmediumvsKimi K2.7 Codemedium Qwen3.5-FlashmediumvsStep 3.7 Flashhigh Qwen3.5-FlashmediumvsGemini 3.5 Flashnone Qwen3.5-FlashmediumvsGemini 3 Flash Previewnone Qwen3.5-FlashmediumvsGemini 3.5 Flashhigh Qwen3.5-FlashmediumvsGemini 3 Flash Previewmedium Qwen3.5-FlashmediumvsNemotron 3 Ultra 550b A55bmediumবিনামূল্যে উপলভ্য Qwen3.5-FlashmediumvsGPT-5.5low

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	10.0	10.0
কোডিং	3.7	7.2
সমন্বিত	10.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	7.3	5.9
ডোমেইন-নির্দিষ্ট	5.3	7.2
Sadharon Buddhimotta	6.1	3.1
নির্দেশনা অনুসরণ	10.0	10.0
ধাঁধা সমাধান	8.2	7.2
টুল কলিং	10.0	10.0
সাধারণ জ্ঞান	3.0	10.0

Qwen3.5-Flash

Hamster playing table tennis

#84 Qwen3.5-Flash

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল