AI BENCHY
Advertise here
#106

Qwen3.5-9B

Qwen প্রকাশ: 2026-03-02 পরীক্ষিত হয়েছে: 2026-04-20 17:48 qwen/qwen3.5-9b::medium
(medium) (none)

সারাংশ

Qwen3.5-9B AI BENCHY-তে 4.4 স্কোর করে এবং #106 স্থানে আছে। এর reliability প্রযোজ্য নয়, pass rate 33.3%, মোট খরচ $0.030, এবং গড় response time 73.64s.

Qwen3.5-9B কে আলাদা করে যা: এটি অস্বাভাবিকভাবে বেশি reasoning tokens ব্যবহার করে, যা ধীর বা বেশি খরচের runs ব্যাখ্যা করতে পারে।

ধারাবাহিকতা

7.2

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট আউটপুট টোকেন

196,888

মোট ইনপুট টোকেন

0

ইনপুট মূল্য

$0.100 / 1M

আউটপুট মূল্য

$0.150 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 15

প্রতি চেষ্টায় পাস রেট: 33.3%

অস্থির টেস্ট

6

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

73.64s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 226.38s

প্রতিক্রিয়া সময় (মোট): 1104.60s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#106 Qwen3.5-9B

medium
Cost
$0.001
Time
35.9s
Tokens
3,030 tok

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-06-04 13:41 নতুন টেস্ট যোগ হয়েছে 4.2 5.6 $0.035 তুলনা করুন
2026-05-22 00:18 স্যুইট পরিবর্তিত হয়েছে 4.2 1.7 $0.035 তুলনা করুন
2026-05-08 14:44 স্যুইট পরিবর্তিত হয়েছে 4.3 3.3 $0.035 তুলনা করুন
2026-05-08 14:44 স্যুইট পরিবর্তিত হয়েছে 4.3 3.3 $0.035 তুলনা করুন
2026-04-20 17:48 প্রথম নথিভুক্ত রান 4.4 প্রযোজ্য নয় $0.030 বর্তমান রান

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট ইনপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-04-20 17:48 · প্রথম নথিভুক্ত রান4.47.2প্রযোজ্য নয়3/186196,8880$0.03073.64s
2026-05-22 00:18 · স্যুইট পরিবর্তিত হয়েছে4.27.01.73/207229,6560$0.03580.10s
পার্থক্য+0.2+0.20-1-327680-$0.005-6461ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 5.1 5.8
কোডিং 2.6 10.0
সমন্বিত 3.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 3.6 5.6
ডোমেইন-নির্দিষ্ট 3.6 7.2
Sadharon Buddhimotta 2.8 1.6
নির্দেশনা অনুসরণ 6.4 5.8
ধাঁধা সমাধান 3.1 10.0
টুল কলিং 10.0 10.0

তুলনা করা মডেল