AI BENCHY
Advertise here
#106

Qwen3.5 Plus 2026-02-15

Qwen প্রকাশ: 2026-02-15 পরীক্ষিত হয়েছে: 2026-06-04 13:10 qwen/qwen3.5-plus-02-15::none
(medium) (none)

সারাংশ

Qwen3.5 Plus 2026-02-15 AI BENCHY-তে 5.8 স্কোর করে এবং #106 স্থানে আছে। এর reliability 10.0, pass rate 46.0%, মোট খরচ $0.016, এবং গড় response time 2.31s.

Qwen3.5 Plus 2026-02-15 কে আলাদা করে যা: এটি ধাঁধা সমাধান-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #2; আর Sadharon Buddhimotta এর দুর্বলতম ক্ষেত্র, rank #10.

ধারাবাহিকতা

9.4

মোট খরচ (বর্তমান মূল্য)

$0.016 ↓ -13.7%

পরীক্ষার সময়: $0.019

মোট আউটপুট টোকেন

2,480

মোট ইনপুট টোকেন

45,864

ইনপুট মূল্য

$0.260 / 1M

আউটপুট মূল্য

$1.560 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 12

প্রতি চেষ্টায় পাস রেট: 46.0%

অস্থির টেস্ট

2

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

2.31s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 6.65s

প্রতিক্রিয়া সময় (মোট): 34.63s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#106 Qwen3.5 Plus 2026-02-15

none
খরচ
$0.012
সময়
153.2s
টোকেন
7,787 tok

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-06-04 13:10 নতুন টেস্ট যোগ হয়েছে 6.3 10.0 $0.016 বর্তমান রান
2026-05-21 23:45 স্যুইট পরিবর্তিত হয়েছে 6.4 10.0 $0.018 তুলনা করুন
2026-04-11 01:19 প্রথম নথিভুক্ত রান 6.8 প্রযোজ্য নয় $0.017 তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট ইনপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-06-04 13:10 · বর্তমান রান5.89.410.09/2122,48045,864$0.0162.31s
2026-04-11 01:19 · প্রথম নথিভুক্ত রান6.89.3প্রযোজ্য নয়9/1822,4610$0.0172.60s
পার্থক্য-0.9+0.100+19+45864-$0.001-294ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ ইনপুট মূল্য আউটপুট মূল্য
2026-06-04 15:40 $0.260 / 1M $1.560 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 4.8 10.0
কোডিং 4.3 7.9
সমন্বিত 3.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 10.0 10.0
ডোমেইন-নির্দিষ্ট 5.3 10.0
Sadharon Buddhimotta 4.4 3.0
নির্দেশনা অনুসরণ 10.0 10.0
ধাঁধা সমাধান 7.7 10.0
টুল কলিং 10.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল