AI BENCHY
Advertise here
#115

Qwen3.5 Plus 2026-04-20

Qwen প্রকাশ: 2026-04-20 পরীক্ষিত হয়েছে: 2026-06-04 13:10 qwen/qwen3.5-plus-20260420::none
(medium) (none)

সারাংশ

Qwen3.5 Plus 2026-04-20 AI BENCHY-তে 5.7 স্কোর করে এবং #115 স্থানে আছে। এর reliability 10.0, pass rate 41.3%, মোট খরচ $0.032, এবং গড় response time 4.39s.

Qwen3.5 Plus 2026-04-20 কে আলাদা করে যা: এটি ধাঁধা সমাধান-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #3; আর নির্দেশনা অনুসরণ এর দুর্বলতম ক্ষেত্র, rank #11.

ধারাবাহিকতা

8.6

মোট খরচ (বর্তমান মূল্য)

$0.032 ↓ -23.7%

পরীক্ষার সময়: $0.042

মোট আউটপুট টোকেন

11,145

মোট ইনপুট টোকেন

38,910

ইনপুট মূল্য

$0.300 / 1M

আউটপুট মূল্য

$1.800 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 14

প্রতি চেষ্টায় পাস রেট: 41.3%

অস্থির টেস্ট

4

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

4.39s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 33.34s

প্রতিক্রিয়া সময় (মোট): 92.26s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#115 Qwen3.5 Plus 2026-04-20

none
Cost
$0.008
Time
77.0s
Tokens
4,369 tok

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-06-04 13:10 নতুন টেস্ট যোগ হয়েছে 5.7 10.0 $0.032 বর্তমান রান
2026-05-21 23:47 স্যুইট পরিবর্তিত হয়েছে 5.8 9.9 $0.041 তুলনা করুন
2026-05-08 13:10 স্যুইট পরিবর্তিত হয়েছে 5.9 9.9 $0.040 তুলনা করুন
2026-05-08 13:10 স্যুইট পরিবর্তিত হয়েছে 5.9 9.9 $0.040 তুলনা করুন
2026-04-27 23:05 প্রথম রান 5.8 9.8 $0.024 তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট ইনপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-06-04 13:10 · বর্তমান রান5.78.610.07/21411,14538,910$0.0324.39s
2026-05-21 23:47 · স্যুইট পরিবর্তিত হয়েছে5.88.59.97/20411,1740$0.0414.58s
পার্থক্য-0.1+0.1+0.100-29+38910-$0.010-184ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ ইনপুট মূল্য আউটপুট মূল্য
2026-06-04 15:40 $0.300 / 1M $1.800 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 4.8 10.0
কোডিং 3.9 7.8
সমন্বিত 2.8 1.6
ডেটা পার্সিং ও নিষ্কাশন 10.0 10.0
ডোমেইন-নির্দিষ্ট 5.3 10.0
Sadharon Buddhimotta 4.8 10.0
নির্দেশনা অনুসরণ 6.2 5.8
ধাঁধা সমাধান 6.7 7.9
টুল কলিং 10.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল